Big Data at 10: ใหญ่กว่าหมายถึงดีกว่าไหม

Big Data at 10: ใหญ่กว่าหมายถึงดีกว่าไหม

คลิกเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับผู้แต่ง Mathias Golombek หากเวลานี้ 10 ปีที่แล้วคุณกำลังทำงานด้านข้อมูลและการวิเคราะห์ มีบางอย่างกำลังจะเกิดขึ้นซึ่งจะครอบงำชีวิตส่วนใหญ่ของคุณในอาชีพการงานของคุณ ฉันกำลังพูดถึงการเกิดขึ้นของ “ข้อมูลขนาดใหญ่” ฉันเพิ่งอ่านว่าที่มาของแนวคิดนั้นสามารถสืบย้อนไปถึงได้ 2011 นอกเหนือจากการเตือนฉันอย่างแน่ชัดว่าฉันอยู่ในอุตสาหกรรมนี้มานานแค่ไหนแล้ว สิ่งนี้ทำให้ฉันมีเหตุผลที่จะไตร่ตรองถึงสิ่งที่จริงๆ แล้วเอะอะทั้งหมดนั้นเกี่ยวกับอะไร Big Data หรือ Big Diversion? ฉัน (และยังคง) สงสัยเกี่ยวกับวิธีการอธิบายข้อมูลขนาดใหญ่ ฉันรู้สึกว่าวิธีที่ดีที่สุดคือการคิดว่าข้อมูลขนาดใหญ่เป็นผลพลอยได้จากการแปลงเป็นดิจิทัลของธุรกิจทั้งหมด ไม่ใช่คุณลักษณะที่กำหนดหรือตัวขับเคลื่อนของการเปลี่ยนแปลงนี้ แต่ธุรกิจจำนวนมากกลับได้รับการสนับสนุนโดยนักวิเคราะห์และที่ปรึกษาให้เชื่อว่าพวกเขาสามารถบรรลุการเปลี่ยนแปลงได้โดยการเอาชนะความท้าทายทางเทคนิคที่เกี่ยวข้องกับขนาดข้อมูล ไม่ว่าโดยตรงหรือโดยอ้อม ฉันเขียนเกี่ยวกับเรื่องนี้ใน 2015 หากคุณต้องการดำดิ่งสู่ความคับข้องใจนี้ ผลจากการหมกมุ่นอยู่กับความท้าทายทางเทคนิคหมายความว่าหลายปีที่ผ่านมาข้อมูลขนาดใหญ่เกี่ยวข้องโดยตรงกับ Hadoop, Spark และ data lake ที่เต็มไปด้วยข้อมูลที่ไม่มีโครงสร้าง เทคโนโลยีเหล่านี้กำลังจะครองโลก แต่ในท้ายที่สุด โครงการส่วนใหญ่ล้มเหลวหรือไม่ได้รับมูลค่าที่คาดหวัง ทุกวันนี้ เป็นที่ยอมรับกันโดยทั่วไปว่าฐานข้อมูลเชิงสัมพันธ์ที่มีโครงสร้างเป็นแกนหลักที่เหมาะสมกว่าสำหรับการวิเคราะห์ข้อมูลและแอปพลิเคชันข้อมูล การคิดเกี่ยวกับข้อมูลขนาดใหญ่นี้ทำให้เกิดปัญหาสองประการ ประการแรก การจัดเก็บข้อมูลกองใหญ่ในราคาประหยัดทำให้บริษัทต่างๆ สามารถสร้าง Data Lake และแหล่งเก็บข้อมูลขนาดใหญ่ที่พวกเขาพยายามดิ้นรนเพื่อดึงคุณค่าออกมาได้มาก ด้วยเหตุนี้ Data Lake เหล่านี้จึงกลายเป็นทรัพยากรการจัดเก็บข้อมูลแบบพาสซีฟมากกว่าที่จะเป็นชั้นข้อมูลแบบรวมศูนย์และแหล่งที่มาของข้อมูลเชิงลึกใหม่ ประการที่สอง การมุ่งเน้นที่เทคโนโลยีทำให้องค์กรหันเหความสนใจจากความท้าทายที่แท้จริงของการสร้างวัฒนธรรมที่ขับเคลื่อนด้วยข้อมูล ทีมงานขนาดใหญ่ได้รับการว่าจ้างให้จัดการกับเทคโนโลยีข้อมูลขนาดใหญ่ที่ซับซ้อน แต่นั่นทำให้กลุ่มเหล่านี้กลายเป็นทีมพัฒนาที่มุ่งเน้นการนำไปใช้ในระดับเทคโนโลยีมากกว่าที่จะเปลี่ยนแปลงบริษัท ใช้เวลานานกว่าที่เคยทำมาเพื่อพิสูจน์ว่ากุญแจสำหรับวัฒนธรรมที่ขับเคลื่อนด้วยข้อมูลอยู่ในความเรียบง่ายของเทคโนโลยีแทนที่จะเป็นความซับซ้อน ในการสร้างกลยุทธ์ข้อมูลที่ถูกต้อง การรักษาความมุ่งมั่นของผู้นำ การศึกษาผู้ใช้ และการกำหนดมาตรฐาน กระบวนการ และกฎเกณฑ์ของการมีส่วนร่วม ตกลง สบายดี – มันไม่ได้แย่ไปซะหมด เรายังห่างไกลจากสถานะที่บริษัทต่างๆ มักขับเคลื่อนด้วยข้อมูลหรือแปลงข้อมูลเป็นประจำ อย่างไรก็ตาม ในขณะที่มันล้มเหลว (ในตอนนี้) ในการทำตามสัญญา แต่บิ๊กดาต้าสามารถให้เครดิตกับสิ่งที่ยอดเยี่ยมมากมายในโลกของการวิเคราะห์องค์กรในปัจจุบัน องค์กรต่างๆ ได้สร้างกลยุทธ์และทีมทั้งหมดโดยเฉพาะเพื่อจัดการข้อมูลเป็นทรัพย์สินขององค์กร ซึ่งมักจะอยู่ภายใต้ผู้นำที่ทุ่มเทให้กับผู้บริหาร ไม่มีสิ่งใดเกิดขึ้นก่อนแนวโน้มของข้อมูลขนาดใหญ่ นอกจากนี้ยังมีการปรับปรุงพื้นฐานเกี่ยวกับวิธีการเปลี่ยนชุดข้อมูลขนาดใหญ่เป็นข้อมูลเชิงลึก ใช้ในการตัดสินใจโดยอัตโนมัติ หรือใช้เพื่อขับเคลื่อนการเพิ่มประสิทธิภาพ ต้องขอบคุณประสบการณ์ที่ได้รับและการวางรากฐานระหว่างการเดินทางของข้อมูลขนาดใหญ่ การผสานรวมแหล่งข้อมูลที่หลากหลายทำได้ง่ายกว่าที่เคย การปรับปรุงการรู้เท่าทันข้อมูล มาตรการคุณภาพข้อมูล การกำกับดูแลข้อมูล แค็ตตาล็อกข้อมูล และการรักษาความปลอดภัย – เรามีการเคลื่อนย้ายข้อมูลขนาดใหญ่เพื่อขอบคุณสำหรับการพัฒนาทั้งหมดเหล่านี้ ที่ไหนต่อไป? ถึงกระนั้น ความปรารถนาของฉันในทศวรรษหน้าก็คือข้อมูลและการวิเคราะห์ และผู้เชี่ยวชาญที่ทำงานในสาขาเหล่านี้ ที่จะหลุดพ้นจากการเชื่อมโยงใดๆ กับข้อมูลขนาดใหญ่ ขนาดเล็ก กลาง หรือเพียงตัวอย่างเสียงทางสถิติของชุดข้อมูลที่ใหญ่กว่านั้นก็สามารถสร้างกรณีการใช้งานที่น่าทึ่ง แจ้งการตัดสินใจที่สำคัญหรือเพิ่มประสิทธิภาพกระบวนการ หลังจากให้ความสำคัญกับความซับซ้อนของยุคข้อมูลขนาดใหญ่แล้ว ฉันก็ตั้งตารอที่จะเห็นว่าการมุ่งเน้นที่ความเรียบง่ายในปัจจุบันเป็นอย่างไร สำหรับฉัน การบรรจบกันของ Data Science ฐานข้อมูลเชิงสัมพันธ์ และระบบธุรกิจอัจฉริยะ ในที่สุดควรจะสามารถส่งมอบคำมั่นสัญญาของทีมที่ขับเคลื่อนด้วยข้อมูลและวัฒนธรรมที่พวกเขาเติบโตได้ (สิ่งนี้สำคัญเพราะ Data Science จะต้องดำเนินการและให้บริการแก่ผู้ใช้ข้อมูลมาตรฐาน หากไม่ต้องการให้เกิดซ้ำในโลก Hadoop และแซนด์บ็อกซ์ที่ลึกลับ) ในทำนองเดียวกัน การถ่ายโอนความเป็นเจ้าของข้อมูลจะเป็นการเปลี่ยนแปลงอย่างแท้จริง ธุรกิจเพื่อให้ทีมข้อมูลส่วนกลางไม่เป็นปัญหาคอขวดสำหรับโครงการและแอปพลิเคชันอีกต่อไป เส้นทางที่เป็นไปได้ที่น่าสนใจสำหรับผลลัพธ์นี้ ได้แก่ การแยกสถาปัตยกรรมข้อมูลแบบรวมศูนย์เพื่อสนับสนุนโมเดลแบบกระจาย เช่น การออกแบบ data mesh ทุกวันนี้ยังซับซ้อนเกินไปที่จะสร้างแอปพลิเคชันข้อมูล อุตสาหกรรมจึงจำเป็นต้องเร่งการพัฒนาเครื่องมือและเทคนิคที่ช่วยให้องค์กรสามารถทำข้อมูลได้มากขึ้นโดยไม่ต้องใช้ทักษะเฉพาะทาง แนวโน้มไฮเปอร์ออโตเมชั่นที่เกี่ยวข้องกับ RPA, AI และแมชชีนเลิร์นนิงล้วนให้คำมั่นสัญญาอย่างมากในที่นี้ ทั้งเกี่ยวกับวิธีที่เราทำงานกับข้อมูลและวิธีที่เราใช้เพื่อทำให้กระบวนการของบริษัทในขอบเขตกว้างกว่าในปัจจุบันเป็นดิจิทัล ตัวอย่างเช่น นานแค่ไหนก่อนที่เราจะสามารถสร้างฝาแฝดดิจิทัลของทั้งองค์กร ซึ่งเราสามารถเพิ่มประสิทธิภาพกระบวนการและการดำเนินงานได้อย่างต่อเนื่อง และสุดท้ายถ้าไม่มากเกินไปที่จะถาม ฉันหวังว่านี่จะเป็นครั้งสุดท้ายอย่างน้อย 10 ปีที่ฉันต้องเขียนบล็อกโพสต์เกี่ยวกับบิ๊กดาต้า .

  • บ้าน
  • ธุรกิจ
  • วิทยาศาสตร์ข้อมูล
  • การตลาดดิจิทัล

  • ตลาดการค้า
  • Leave a comment

    Your email address will not be published. Required fields are marked *