Data science

Data Fabrics ปรากฏขึ้นเพื่อบรรเทาฝันร้ายการจัดการข้อมูลบนคลาวด์

บริษัทต่างๆ กำลังเพิ่มการวิเคราะห์ขั้นสูงและโครงการ AI ในระบบคลาวด์ ซึ่งช่วยให้พวกเขาตัดสินใจโดยใช้ข้อมูลเป็นหลักในตลาดที่มีการแข่งขันสูงขึ้น อย่างไรก็ตาม การเดินขบวนสู่คลาวด์ยังเผยให้เห็นจุดอ่อนในกลยุทธ์การจัดการข้อมูลของบริษัท นั่นเป็นแรงผลักดันให้บางบริษัทนำ data fabrics มาใช้ ซึ่งสามารถช่วยในการแก้ไขช่องว่างในการปรับใช้ไฮบริดและมัลติคลาวด์ หนึ่งในนักวิเคราะห์ที่เฝ้าสังเกตการทดลองและความยากลำบากของการจัดการข้อมูลตลอดหลายปีที่ผ่านมาคือ Noel Yuhanna แห่ง Forrester ตามที่ Yuhanna มองเห็น การเพิ่มขึ้นของระบบคลาวด์ทำให้ความท้าทายที่มีอยู่เดิมของบริษัทต่างๆ กับการจัดการข้อมูลทวีความรุนแรงมากขึ้น “ฉันคุยกับลูกค้าสามถึงสี่รายทุกวัน ส่วนใหญ่เป็นบริษัทฟอร์จูน 1000 และพวกเขา “เฮ้ เรามีปัญหาทุกประเภทเกี่ยวกับการจัดการข้อมูล ไม่ใช่แค่เพียงการย้ายข้อมูลและไซโลเท่านั้น แต่ยังรวมถึงความปลอดภัยของข้อมูลและการกำกับดูแล และการผสานรวม การแปลง และการเตรียมการและคุณภาพ” Yuhanna กล่าวกับ Datanami “มันเป็นฝันร้าย” Yuhanna อยู่ในระดับแนวหน้าของแนวคิด data fabric เมื่อมันปรากฏตัวครั้งแรกในช่วงกลาง 15 และตอนนี้เขากำลังจับตามองอยู่ว่าการนำระบบคลาวด์ที่เฟื่องฟูกำลังเพิ่มความต้องการ data fabrics ใน 2020 s “เราพูดถึงเรื่องนี้ [data fabric] มาเป็นเวลา 15 ปีแล้ว” Yuhanna กล่าว “เมื่อ 15 ปีที่แล้ว เราเคยพูดถึง data fabric ส่วนใหญ่ในสถานที่ แต่วันนี้เกี่ยวข้องกับคลาวด์และมัลติคลาวด์และไฮบริดคลาวด์ที่ขอบ ดังนั้นผ้าจึงมีความสำคัญมากยิ่งขึ้น” Fabric in the Cloud ตามที่ Yuhanna ระบุไว้ใน 1000 data fabric เป็นเลเยอร์นามธรรมที่เชื่อมโยงการรวบรวมเครื่องมือข้อมูลที่แตกต่างกันซึ่งระบุจุดปวดที่สำคัญในขนาดใหญ่ โครงการข้อมูล โซลูชัน data fabric ควรนำเสนอความสามารถในด้านการเข้าถึงข้อมูล การค้นพบ การแปลง การบูรณาการ ความปลอดภัย การกำกับดูแล สายเลือด และการประสาน นอกจากนี้ยังควรให้ความสามารถในการบริการตนเอง เช่นเดียวกับความสามารถกราฟบางส่วนเพื่อระบุข้อมูลที่เชื่อมต่อ การแสดงภาพหนึ่งของ data fabric โดยได้รับความอนุเคราะห์จากผู้จำหน่ายการวิเคราะห์ AtScale ด้วยการให้วิธีการที่จะนำความสามารถในการจัดการข้อมูลเหล่านี้มาใช้กับข้อมูลที่ครอบคลุมไซโลเหล่านี้ทั้งหมด data fabric สามารถช่วยบรรเทาความท้าทายในการจัดการข้อมูลหลักที่ทำให้บริษัทต่างๆ กลับมาจากการใช้ข้อมูลระดับสูง กรณีต่างๆ รวมถึงการวิเคราะห์ขั้นสูงและ AI ในระบบคลาวด์ ผู้จำหน่ายรายหนึ่งที่ค้นพบแรงฉุดด้วยโซลูชัน data fabric คือ Ataccama บริษัท ซึ่งตั้งชื่อตามทะเลทรายชิลี แต่มีสำนักงานใหญ่อยู่ที่โตรอนโตและสำนักงาน R&D ในกรุงปราก สาธารณรัฐเช็ก ประสบกับความต้องการโซลูชั่นที่เพิ่มขึ้นตั้งแต่ COVID เริ่มนำลูกค้าไปยังระบบคลาวด์ในจำนวนที่มากขึ้น Marek กล่าว Ovcacek รองประธานฝ่ายกลยุทธ์แพลตฟอร์มของ Ataccama “สิ่งที่ผมเห็นจากลูกค้าและในตลาดตอนนี้ไม่ใช่แค่คลาวด์เดียว พวกมันมักจะเคลื่อนไปยังหลายคลาวด์” Ovcacek บอก Datanami “ทีมหนึ่งกำลังทำงานเกี่ยวกับโซลูชันใน Azure และอีกทีมหนึ่งกำลังทำงานเกี่ยวกับโซลูชันใน Google Cloud และอื่นๆ” หากไม่มีวิธีเชื่อมโยงกระบวนการจัดการข้อมูลข้ามระบบคลาวด์และกิจกรรมภายในองค์กร บริษัทต่างๆ ก็เสี่ยงที่โครงการข้อมูลของพวกเขาจะหมดไป เขากล่าว “เห็นได้ชัดว่ามันค่อนข้างจะเลอะเทอะถ้าคุณมีการตั้งค่าแบบนี้” เขากล่าว Ovcacek ของ Sum of Fabric กล่าวว่าลูกค้ากำลังมาที่ Ataccama ด้วยแนวคิดที่คลุมเครือเกี่ยวกับสิ่งที่พวกเขาต้องการ พวกเขาอาจเริ่มถามเกี่ยวกับแค็ตตาล็อกข้อมูลของบริษัท ซึ่งนำไปสู่ความต้องการด้านคุณภาพข้อมูลที่ดีขึ้น เมื่อถึงจุดหนึ่ง การสนทนาจะเปลี่ยนอย่างชัดเจนในทิศทางของโครงสร้างข้อมูล รวมถึงสิ่งที่เป็นอยู่และสิ่งที่สามารถทำได้สำหรับลูกค้า เมฆได้กลายเป็นแหล่งเก็บข้อมูลหลักสำหรับ data fabric (Phonlamai Photo/Shutterstock) ในมุมมองของ Ovcacek ส่วนประกอบสำคัญที่เปลี่ยนกลุ่มเครื่องมือการจัดการข้อมูลที่แตกต่างกันให้กลายเป็น data fabric เป็นการขจัดความจำเป็นในการจัดการข้อมูลด้วยตนเอง ระบบอัตโนมัตินี้ส่วนใหญ่ขับเคลื่อนโดยข้อมูลเมตาพื้นฐาน ซึ่งเชื่อมโยงงานการจัดการข้อมูลต่างๆ “ในอุดมคติของฉัน เมื่อโครงสร้างข้อมูลเสร็จสมบูรณ์ การโต้ตอบของมนุษย์แบบแมนนวลนั้นไม่มีอยู่อีกต่อไป หรือเป็นความลับที่ซ่อนอยู่เบื้องหลัง และมันราบรื่นตรงที่ฉันได้สิ่งที่ต้องการ” เขากล่าว “คุณสามารถมีทุกส่วนของ data fabric ได้…. Gartner เรียกพวกมันว่า 6 เสาหลักของ data fabric คุณสามารถมีได้ทั้งหมดในองค์กร ถ้าคุณไม่ใช้มันอย่างถูกวิธี แสดงว่าคุณไม่มี data fabric” ภายใต้ระบบเก่า เมื่อพนักงานต้องการเข้าถึงข้อมูล พวกเขาต้องไปที่องค์กรและขอให้ใครสักคนมอบการเข้าถึงข้อมูลให้กับพวกเขา นี่เป็นกระบวนการที่ต้องทำด้วยตนเองเป็นส่วนใหญ่ และทำให้สิ่งต่างๆ ช้าลง Ovcacek กล่าว “ตอนนี้กระบวนการนี้ใช้ data fabric” เขากล่าว “เมื่อคุณมีกรณีการใช้งาน…มีกระบวนการอัตโนมัติมากมายที่ให้ข้อมูลแก่คุณ และให้สิ่งที่คุณต้องการอย่างแท้จริง ฉันไม่ได้บอกว่าไม่มีการตรวจสอบด้วยตนเอง แต่ไม่จำเป็นว่าฉันจะต้องโทรหาใครบางคนจากองค์กรอื่นเพื่อให้ฉันเข้าถึงข้อมูลได้ จะต้องสร้างขึ้นในการแก้ปัญหา” ดาต้าแฟบริคก็ควรจะสามารถประกอบกันได้ด้วย เขากล่าว กล่าวคือ ลูกค้าควรจะสามารถแทนที่ด้านหนึ่งของ data fabric ได้ เช่น data Catalog และแทนที่ด้วยโซลูชันอื่น “ฉันต้องการมีมาตรฐานสำหรับผู้จำหน่าย data fabric” Ovacek กล่าว “ฉันไม่คิดว่ามันจะเกิดขึ้น” อย่างไรก็ตาม APIs สามารถช่วยได้ เขากล่าว Cloud Fabrics Growing Yuhanna เป็นผู้ประพันธ์ Forrester Wave for Enterprise Data Fabrics, Q2 2020 ความต้องการการจัดการข้อมูลที่เร่งด่วนที่สุดกำลังเกิดขึ้นในคลาวด์ ต้องขอบคุณนวัตกรรมที่เกิดขึ้นมากมาย และการประหยัดโครงสร้างพื้นฐานที่สามารถมีได้ บริษัทที่มุ่งมั่นที่จะขับเคลื่อนด้วยข้อมูลต้องการให้นักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์สามารถเข้าถึงข้อมูลทุกประเภทได้อย่างรวดเร็วและง่ายดาย ในขณะที่ปฏิบัติตามข้อจำกัดด้านความปลอดภัย ความเป็นส่วนตัว และการกำกับดูแลที่จำเป็น นี่คือสิ่งที่ data fabric ทำ ในมุมมองของ Yuhanna ลูกค้าจะเรียกใช้อินสแตนซ์ data fabric ในแต่ละสภาพแวดล้อมคลาวด์ที่ลูกค้าใช้งาน ดังนั้นสภาพแวดล้อม AWS ของพวกเขาจะมีอินสแตนซ์ data fabric เช่นเดียวกับสภาพแวดล้อม Google Cloud และ Microsoft Azure บริษัทต่างๆ สามารถนำ data fabrics จากผู้ขายที่เป็นบุคคลภายนอกมาใช้งาน เช่น Talend, Informatica, Cambridge Semantics, Cloudera, Infoworks และ Ataccama เป็นต้น พวกเขายังสามารถใช้โครงสร้างข้อมูลที่ผู้ให้บริการระบบคลาวด์เริ่มนำเสนอ เช่น ข้อเสนอ DataPlex ของ Google Cloud ซึ่งเปิดตัวในเดือนมีนาคม Yuhanna กล่าวว่า “ฉันคิดว่า Microsoft กำลังเริ่มพัฒนาไปสู่ ​​Fabric ด้วยบริการข้อมูลทั่วไป ซึ่งเป็นโมเดลข้อมูลทั่วไปที่พวกเขาใช้อยู่” Yuhanna กล่าว “แต่ดูเหมือนว่า Google จะมีความได้เปรียบเล็กน้อยในด้านโครงสร้างนี้ พวกเขายังไม่เสร็จ มันยังคงพัฒนาบนแพลตฟอร์ม” แม้ว่าแฟบริกแต่ละตัวจะมีกระบวนการและข้อมูลเมตาที่เป็นกรรมสิทธิ์ของตัวเอง แต่จะมีการผสานรวมในระดับหนึ่งโดยใช้ API รวมถึงข้อมูล JSON Yuhanna กล่าว “API และ JSON มีบทบาทสำคัญในการกำหนดมาตรฐานในระดับหนึ่ง” เขากล่าว Forrester ประมาณการว่า 20% ขององค์กรได้ใช้ระบบคลาวด์หลายตัวในวันนี้ และคาดว่าตัวเลขดังกล่าวจะเพิ่มเป็นสองเท่าในอีกสามปีข้างหน้า นั่นทำให้เกิดความกังวลอย่างแท้จริง Yuhanna กล่าว และยังเป็นโอกาสสำหรับผู้ให้บริการโซลูชัน data fabric “ตอนนี้ผู้คนจำนวนมากเริ่มใช้ประโยชน์จากแฟบริค เนื่องจากข้อมูลถูกกระจายไปทั่วคลาวด์ต่างๆ เหล่านี้” เขากล่าว “ใช่แล้ว ทุกวันนี้ Fabric มีบทบาทสำคัญในอุตสาหกรรมผ่านมัลติคลาวด์และไฮบริดคลาวด์” รายการที่เกี่ยวข้อง: Google Cloud จัดการกับการรวมข้อมูลด้วยข้อเสนอใหม่ กลับไปสู่พื้นฐาน: การจัดการข้อมูลขนาดใหญ่ในระบบไฮบริด ค่าใช้จ่ายเกินในโลกมัลติคลาวด์ และการกำกับดูแลที่ผิดพลาด: ภัยคุกคามสองประการต่อการเดินทางข้อมูลบนคลาวด์ของคุณ

วิทยาศาสตร์ข้อมูล

  • การตลาดดิจิทัล
  • ตลาดการค้า
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button