Data science

วิทยาศาสตร์ข้อมูลรหัสต่ำไม่เหมือนกับการเรียนรู้ของเครื่องอัตโนมัติ

โพสต์ที่ได้รับการสนับสนุน ในคุณสมบัติพิเศษของแขกรับเชิญนี้ Rosaria Silipo, Ph.D., นักวิทยาศาสตร์ข้อมูลหลักที่ KNIME กล่าวถึงความแตกต่างระหว่างการเรียนรู้ของเครื่องอัตโนมัติและเครื่องมือที่ใช้รหัสต่ำสำหรับวิทยาศาสตร์ข้อมูล Rosaria เป็นผู้เขียนสิ่งพิมพ์ทางเทคนิค 50+ ซึ่งรวมถึงหนังสือเล่มล่าสุดของเธอ “Practicing Data Science: A Collection of Case Studies” เธอสำเร็จการศึกษาระดับปริญญาเอกด้านวิศวกรรมชีวภาพและใช้เวลามากกว่า 25 ปีในการทำงานในโครงการวิทยาศาสตร์ข้อมูลสำหรับบริษัทต่างๆ ในหลากหลายสาขา รวมถึง IoT ความฉลาดของลูกค้า การเงิน อุตสาหกรรม และความปลอดภัยทางไซเบอร์ ฉันได้รับการสัมภาษณ์หลายครั้งเมื่อเร็ว ๆ นี้ เมื่อฉันอธิบายให้ผู้สมัครฟัง อย่างน้อยกับผู้สมัครที่ยังไม่รู้จัก KNIME ว่า KNIME Analytics Platform เป็นเครื่องมือที่มีโค้ดน้อยสำหรับวิทยาศาสตร์ข้อมูล และใช้การเขียนโปรแกรมด้วยภาพเพื่อสร้างขั้นตอนการดำเนินการเพื่อนำข้อมูลของคุณจาก A ( มักจะเป็นแหล่งข้อมูล) ถึง B (โดยปกติคือโมเดลที่ได้รับการฝึกอบรมหรือแอปพลิเคชันการปรับใช้) ฉันมักจะได้รับความคิดเห็นว่า “Ah! มันเหมือนกับเครื่องมือสำหรับการเรียนรู้ของเครื่องอัตโนมัติ” ไม่มันไม่ใช่. เป็นเครื่องมือรหัสต่ำสำหรับวิทยาศาสตร์ข้อมูล Low Code Tools เครื่องมือที่ใช้โค้ดต่ำกำลังเป็นที่นิยมมากขึ้นเรื่อยๆ พวกเขาอนุญาตให้ทำงานบางอย่างโดยไม่จำเป็นต้องเข้ารหัส โดยอิงจากการเขียนโปรแกรมด้วยภาพ ซึ่งอยู่บนอินเทอร์เฟซแบบลากและวางเพื่อสร้างไปป์ไลน์ของบล็อก โดยแต่ละบล็อกจะใช้งานเฉพาะ มีโค้ดต่ำหรือไม่มีโค้ด เครื่องมือมากมาย: สำหรับการเงิน การบัญชี การรายงาน การจัดการโครงการ การออกแบบ และอื่นๆ แพลตฟอร์ม KNIME Analytics เป็นเครื่องมือที่ใช้รหัสต่ำสำหรับวิทยาศาสตร์ข้อมูล บล็อกเรียกว่าโหนด แต่ละโหนดดำเนินการกับข้อมูล – การอ่าน การเข้าถึง การรวม การเข้าร่วม การทำให้เป็นมาตรฐาน … – หรือบนแบบจำลอง – การสร้าง การฝึกอบรม การประยุกต์ใช้ การเพิ่มประสิทธิภาพ หรือการให้คะแนน แต่ละโหนดมีกล่องโต้ตอบ GUI ที่แสดงพารามิเตอร์การดำเนินการที่จะตั้งค่า รูปที่ 1 KNIME Workbench โดยเฉพาะอย่างยิ่ง โหนดที่ฝึกโมเดลการเรียนรู้ของเครื่องจะเปิดเผยพารามิเตอร์ไฮเปอร์ของโมเดล เพื่อให้นักวิทยาศาสตร์ข้อมูลสามารถปรับแต่งและปรับแต่งโมเดลได้ ในแง่นี้ แม้ว่า KNIME Analytics Platform จะเป็นโซลูชันที่ใช้โค้ดน้อย แต่ก็ไม่ใช่เครื่องมือ Machine Learning แบบอัตโนมัติ การเรียนรู้ของเครื่องอัตโนมัติ Automated Machine Learning อธิบายถึงชุดของแอปพลิเคชันที่ดึงข้อมูลและจัดเตรียมโมเดลการเรียนรู้ของเครื่องโดยอัตโนมัติ พวกเขาเสนอตัวเลือกการโต้ตอบไม่หรือน้อยมาก นักวิทยาศาสตร์ข้อมูลสามารถทำงานได้กับข้อมูลที่ป้อนเท่านั้น และหลังจากป้อนลงในเครื่องแล้วมีโอกาสน้อยมากที่จะส่งผลต่อรูปแบบสุดท้าย อะไรคือความแตกต่าง? การเรียนรู้ของเครื่องอัตโนมัติเป็นธุรกิจที่แตกต่างไปจากเดิมอย่างสิ้นเชิงจากเครื่องมือที่มีโค้ดต่ำสำหรับวิทยาศาสตร์ข้อมูล แอปพลิเคชัน Machine Learning แบบอัตโนมัติจะจำกัดให้อยู่ในการฝึกอบรมโมเดลการเรียนรู้ของเครื่องด้วยวิธีอัตโนมัติทั้งหมด ในทางกลับกัน เครื่องมือที่มีโค้ดต่ำสำหรับวิทยาศาสตร์ข้อมูล ครอบคลุมการดำเนินการด้านวิทยาศาสตร์ข้อมูลต่างๆ มากมาย ตั้งแต่การแปลงข้อมูลไปจนถึงอัลกอริธึมการเรียนรู้ของเครื่อง เผยให้เห็นไฮเปอร์พารามิเตอร์จำนวนมากที่เกี่ยวข้องกับคำจำกัดความของแบบจำลองหรือของการแปลง เมื่อใช้แอปพลิเคชัน Machine Learning แบบอัตโนมัติ คุณต้องวางใจว่าการตั้งค่าเริ่มต้นที่ใช้เหมาะสมกับกรณีธุรกิจและข้อมูลของคุณ การตั้งค่าเริ่มต้นอาจเพียงพอสำหรับปัญหาที่มีเงื่อนไขที่ดีอย่างง่าย การตั้งค่าเริ่มต้นอาจสั้นลงเมื่อกรณีธุรกิจของคุณต้องการแนวทางที่แตกต่างออกไปเล็กน้อย หรือเมื่อชุดข้อมูลของคุณไม่ครอบคลุมสถานการณ์ที่เป็นไปได้ทั้งหมดด้วยวิธีที่สะอาด เมื่อใช้เครื่องมือที่ใช้โค้ดต่ำเพื่อฝึกโมเดลการเรียนรู้ของเครื่อง คุณจะมีความยืดหยุ่นมากขึ้น คุณสามารถเลือกสถาปัตยกรรม ลองใช้ค่าต่าง ๆ มากมายสำหรับไฮเปอร์พารามิเตอร์ เพิ่มประสิทธิภาพอย่างน้อยหนึ่งค่า และโดยทั่วไป ทำการทดลองสองสามอย่างกับข้อมูล สถาปัตยกรรม และไฮเปอร์พารามิเตอร์ก่อนส่งแบบจำลองไปยัง แอปพลิเคชันการปรับใช้ เครื่องมือที่ใช้โค้ดต่ำช่วยขจัดอุปสรรคในการเขียนโค้ด แต่ยังคงให้อิสระในการทดลอง การเรียนรู้ของเครื่องอัตโนมัติและเครื่องมือที่ใช้โค้ดต่ำนั้นไม่ได้เกิดขึ้นพร้อมกัน คุณสามารถสร้างโซลูชันแมชชีนเลิร์นนิงอัตโนมัติโดยใช้เครื่องมือที่ใช้โค้ดต่ำ ตัวอย่างเช่น เพื่อนร่วมงานของฉัน Paolo และ Simon ได้สร้างขึ้นมาโดยใช้ KNIME Analytics Platform และตั้งชื่อว่า Guided Automation ประกอบด้วยสี่ขั้นตอนหลัก: อัปโหลดชุดข้อมูล กำหนดเป้าหมาย และตั้งค่าความอดทนเป็นคุณสมบัติการป้อนข้อมูลที่ให้ข้อมูลน้อยลง เลือกโมเดลการเรียนรู้ของเครื่องเพื่อฝึกและแพลตฟอร์มการดำเนินการ ตรวจสอบประสิทธิภาพของแบบจำลองที่ได้รับการฝึกอบรม คุณสามารถค้นหาได้ใน KNIME Hub ดาวน์โหลด ป้อนข้อมูลด้วยข้อมูลของคุณ เรียกใช้งาน และดูว่าโมเดลที่สร้างมาแก้ปัญหาของคุณได้ดีพอหรือไม่ โดยสรุป คุณสามารถใช้เครื่องมือที่ใช้โค้ดต่ำเพื่อพัฒนาเว็บแอปพลิเคชันการเรียนรู้ของเครื่องอัตโนมัติได้ แต่คุณไม่สามารถทำตรงกันข้ามได้ รูปที่ 2 เว็บแอปพลิเคชัน Guided Automation ที่พัฒนาขึ้นใน 2019 โดยเพื่อนร่วมงานของฉัน Paolo และ Simon ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

  • บ้าน
  • ธุรกิจ
  • วิทยาศาสตร์ข้อมูล
  • การตลาดดิจิทัล

  • ตลาดการค้า
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button