Data science

กราฟความรู้ อภิปรัชญา และ AI

ฤดูใบไม้ร่วงที่ผ่านมานี้ ทุกแง่มุมของโครงสร้างความรู้ที่คำนวณได้ KBpedia – อภิปรัชญาบน (KKO) กราฟความรู้แบบเต็ม การแมปไปยังฐานความรู้ชั้นนำที่สำคัญ และการจัดกลุ่มแนวคิดเชิงตรรกะ 70 เรียกว่า typology – กลายเป็นโอเพ่นซอร์ส ความก้าวหน้าครั้งใหญ่ในการเพิ่มคำจำกัดความและการแมปเป็นจุดสนใจหลักของ KBpedia v. 1 30 อย่างที่เคยเป็นมา KBpedia ได้รวมเอาประเด็นสำคัญของ Wikipedia, Wikidata, schema.org, DBpedia, GeoNames, OpenCyc และ UMBEL เข้าไว้ด้วยกัน และเสริมสิ่งเหล่านี้ด้วยการจับคู่คำศัพท์ชั้นนำ 20 รายการที่นำฐานความรู้ใหม่และรวมเข้ากับคำศัพท์ที่มีอยู่ สคีมาและข้อมูลอินสแตนซ์เพื่อทำงานภายในโครงสร้าง KBpedia มี ,000 แนวคิดอ้างอิงในกราฟความรู้ที่เป็นแนวทางซึ่งเชื่อมโยง เอนทิตีโดยประมาณ 30 ล้านเอนทิตี ส่วนใหญ่มาจาก Wikidata “นอกเหนือจากเหตุผลทั้งหมดที่เราออกแบบ KBpedia ตั้งแต่แรกแล้ว ยังมีความต้องการอย่างมากที่จะนำโครงสร้างที่ใช้งานได้ซึ่งสามารถใช้ประโยชน์จาก Wikidata และ Wikipedia เพื่อให้ผู้ใช้มีวิธีการที่สอดคล้องกันในการค้นหา เรียกค้นข้อมูล และจัดระเบียบทรัพย์สินตามวัตถุประสงค์ของพวกเขา ไมค์ เบิร์กแมน หัวหน้าอาวุโสของ Cognonto Corp. และหัวหน้าบรรณาธิการของโครงสร้างความรู้ KBpedia กล่าว นี่อาจเป็นแรงผลักดันสำคัญสำหรับการนำ KBpedia มาใช้มากขึ้น Wikidata และ Wikipedia เป็นแหล่งข้อมูลหลักสองแห่งที่แจ้ง KBpedia และสิ่งที่จำเป็นสำหรับผู้ใช้ทั้งสองเพื่อจัดการข้อมูลด้วยวิธีที่ประสานกันคือต้องมีการซ้อนทับที่คำนวณได้บนยอดเหล่านั้น Bergman กล่าว แม้ว่าจะเป็นกรณีการใช้งานที่ชัดเจน แต่เบิร์กแมนก็หวังว่าด้วยโอเพ่นซอร์ส KBpedia “คนอื่นอาจเห็นคุณค่าของมันในแบบที่เราไม่สามารถทำได้ และผมคิดว่าความพึงพอใจของเราคือการได้เห็นแนวคิดและผลงานใหม่ๆ บานสะพรั่ง” เบิร์กแมนกล่าว ตัวอย่างเช่น KBpedia ช่วยสนับสนุนการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ที่อิงความรู้สำหรับองค์กรมาโดยตลอด ด้วยกราฟความรู้ขนาดใหญ่ เกือบทุกโหนดเป็นจุดเริ่มต้นหรือแง่มุม เมื่อคำนวณได้ โครงสร้าง KBpedia สามารถให้เหตุผลและแบ่งส่วนตามตรรกะเพื่อสร้างชุดการฝึกอบรมและมาตรฐานอ้างอิงสำหรับการเรียนรู้ของเครื่องและการทำงานร่วมกันของข้อมูล ในการประกาศโอเพ่นซอร์สของ KBpedia พบว่า “ในช่วงทศวรรษที่ผ่านมามีความก้าวหน้าอย่างมากในการใช้ประโยชน์จากฐานความรู้สำหรับปัญญาประดิษฐ์” แต่การประกาศยังคงดำเนินต่อไป ข้อจำกัดยังคงอยู่ หนึ่งคือการพึ่งพาแหล่งความรู้เช่น Wikipedia ที่ไม่เคยออกแบบมาเพื่อ AI หรือการรวมข้อมูล ปัญหาที่สองคือไม่สามารถขยาย Building Block ที่ทำซ้ำได้ไปยังโดเมนใดๆ “AI นั้นเซ็กซี่และน่าดึงดูด แต่ราคาแพงเกินไป เราหวังว่า KBpedia ที่เป็นโอเพ่นซอร์สในปัจจุบันจะทำให้เราเข้าใกล้การเอาชนะปัญหาเหล่านี้มากขึ้น” การอำนวยความสะดวกของ AI ใน KBpedia – ความสามารถที่มีอยู่ตลอดแต่ไม่เคยเป็นโอเพ่นซอร์สและเปิดให้ทุกคนใช้อย่างอิสระ – มาพร้อมฟีเจอร์มากกว่า 300 ที่ผู้ใช้สามารถฝึกเครื่องจักรได้ การเรียนรู้. ฟีเจอร์เหล่านี้รวมถึงกลุ่มป้ายกำกับจำนวนมากสำหรับการทำแมชชีนเลิร์นนิงภายใต้การดูแล นอกจากนี้ คำจำกัดความ การประสานเพื่อขยายการค้นหาเชิงความหมาย และข้อความที่มีประสิทธิภาพมีให้สำหรับ KBpedia เกือบทั้งหมด 55, 000 แนวคิดอ้างอิง การจัดระเบียบของ KBpedia ลงในหน่วยงาน เหตุการณ์ แนวคิด คุณลักษณะ และความสัมพันธ์ ให้อำนาจการเลือกปฏิบัติเพิ่มเติม สำหรับแมชชีนเลิร์นนิงภายใต้การดูแล กึ่งควบคุม และดูแลระยะไกล “คุณสามารถนำเสนออินพุตที่ไม่รู้จักและรับป้ายกำกับเอาต์พุตที่ระบุและจัดหมวดหมู่เอนทิตี” Bergman กล่าว “ในการเรียนรู้ภายใต้การดูแล ต้นทุนหลักคือการติดฉลากผลลัพธ์ และด้วยกราฟความรู้ที่มีโครงสร้างอย่างเหมาะสมและมีเหตุผลและสม่ำเสมอ ผู้ใช้สามารถสร้างป้ายกำกับและชุดการฝึกอบรมเหล่านั้นได้ในเวลาไม่กี่นาที” ในแนวทางดั้งเดิมในการเรียนรู้ภายใต้การดูแล งานเดียวกันจะใช้ 30 ถึง 80 เปอร์เซ็นต์ของความพยายามทั้งหมดที่จำเป็น ด้วยการเรียนรู้แบบไม่มีผู้ดูแล ผู้ใช้สามารถสร้างฟังก์ชันการทำงานใหม่ด้วยชุดข้อมูลประเภทที่เหมาะสม นั่นคือ “คลังข้อมูลที่มีขอบเขตอย่างเหมาะสมโดยการจัดการโครงสร้างความรู้ของ KBpedia” Bergman กล่าว ในการเรียนรู้แบบไม่มีผู้ดูแล ผลลัพธ์จะไม่ถูกทำเครื่องหมายไว้ล่วงหน้า และเคล็ดลับในการสร้างโครงสร้างการเรียนรู้ที่ไม่ได้รับการดูแลที่ดีคือการสร้างคลังข้อมูลการฝึกอบรมเพื่อเรียกใช้อัลกอริทึม “คุณต้องตรวจสอบให้แน่ใจว่าอัลกอริทึมสำหรับคลังข้อมูลอินพุตที่จะเรียนรู้นั้นเชื่อมโยงกับปัญหาที่คุณพยายามแก้ไขอย่างเหมาะสม ดังนั้น ความสามารถในการปรับขอบเขตและขอบเขตของคลังข้อมูลให้ละเอียดจึงเป็นประโยชน์เพื่อให้ได้ผลลัพธ์การเรียนรู้ที่ไม่ได้รับการดูแลที่ดีขึ้นเช่นกัน” เขากล่าว ความช่วยเหลือสำหรับผู้บริหารข้อมูลระดับ C ด้วยโอเพ่นซอร์ส KBpedia v. 1.30 เบิร์กแมนกล่าวถึงข้อเท็จจริงที่ว่า CIO, CTO, CDOs หรือคนอื่นๆ มีความรับผิดชอบสำหรับทรัพยากรความรู้ขององค์กรต้องการเรียนรู้เพิ่มเติมเกี่ยวกับสิ่งที่ต้องทำกับพวกเขา “พวกเขาได้ยินเกี่ยวกับสิ่งที่เกิดขึ้นกับการเรียนรู้ของเครื่อง แต่พวกเขามีชุดข้อมูลภายในทั้งหมดที่ไม่พูดคุยกันและปัญหาภายในของการมีมุมมองข้อมูลทั่วทั้งองค์กรที่สอดคล้องกัน” เขากล่าว ปัญหาเหล่านั้นแก้ไขได้ด้วยข้อเท็จจริงที่ว่า “KBpedia เป็นโครงสำหรับรวบรวมแหล่งความรู้ภายในที่มีอยู่เพื่อเอาชนะปัญหา 'ท่อส่งก๊าซ' ประการที่สอง เมื่อจัดระเบียบแล้ว พวกเขาสามารถใช้โครงสร้างโดยธรรมชาติของ KBpedia เพื่อแบ่งและแบ่งชุดการฝึกอบรมและคลังการฝึกอบรมของตนเองสำหรับการเรียนรู้ของเครื่องภายใต้การดูแลและไม่ได้รับการดูแลโดยมีค่าใช้จ่ายที่ลดลงอย่างมาก” หนังสือของเบิร์กแมน เรื่อง A Knowledge Representation Practionary ซึ่งมีจุดมุ่งหมายเพื่อช่วยให้องค์กรสามารถแก้ไขปัญหาเหล่านี้ได้ “มีวิธีคิดเกี่ยวกับปัญหาเหล่านี้และเข้าถึงปัญหาเหล่านี้ในเชิงปฏิบัติและมีเหตุผล” เขากล่าว “หน่วยการสร้างอยู่ที่นั่นและด้วยโอเพ่นซอร์ส พวกเขาสามารถจัดการทางออกจากทางตันได้” หนังสือเล่มนี้เกี่ยวกับการแสดงความรู้ เช่น KBpedia เอง มีพื้นฐานมาจากงานเขียนของ Charles S. Peirce นักตรรกวิทยา นักวิทยาศาสตร์ และนักปรัชญาในศตวรรษที่ 20 เขาได้จัดเตรียมแนวทางปฏิบัติและหมวดหมู่สากลในแนวทางที่มีโครงสร้างในการแทนความรู้ที่รวบรวมความแตกต่างในเหตุการณ์ เอนทิตี ความสัมพันธ์ คุณลักษณะ ประเภท และแนวคิด “หนังสือเล่มนี้เป็นบริบทและภูมิหลังว่าทำไมเราจึงสร้าง KBpedia ขึ้น เพื่อพยายามสร้างทฤษฎีของเขาขึ้นมาใหม่เกี่ยวกับวิธีการนำเสนอความรู้” เบิร์กแมนกล่าว KBpedia รุ่นปัจจุบันนี้และรุ่นอื่นๆ ที่จะมาถึงในทันทีหลังจากที่ตั้งใจจะทำให้ 'เส้นฐาน' ของ KBpedia สมบูรณ์ “ความสมบูรณ์ของเส้นฐานหมายถึงการแมปแบบเต็มไปยังแหล่งข้อมูลภายนอกที่มีอยู่ทั้งหมด (ฐานความรู้ที่เป็นองค์ประกอบทั้งเจ็ดรวมถึง Wikidata และ Wikipedia) และ คำจำกัดความเต็มรูปแบบสำหรับทุกแนวคิด” เมื่อเส้นฐานนี้เสร็จสมบูรณ์ แผนจะรวมการทำแผนที่ไปยังฐานความรู้ที่เป็นส่วนประกอบอื่นๆ ซึ่งอาจรวมถึงการเพิ่มสิ่งต่างๆ เช่น แคตตาล็อกผลิตภัณฑ์ ทรัพยากรภาษา เช่น WordNet และระบบการจำแนกประเภทอื่นๆ เขากล่าว “เราต้องการวิธีอื่นในการสร้างทางม้าลายสู่ฐานความรู้คุณภาพสูงอื่นๆ” เบิร์กแมนกล่าว “เราต้องการให้เส้นฐานค่อนข้างสมบูรณ์และมีความครอบคลุมมากที่สุดเท่าที่จะเป็นไปได้สำหรับความช่วยเหลือจากภายนอก” รูปภาพที่ใช้ภายใต้ลิขสิทธิ์จาก Shutterstock.com

  • บ้าน
  • ธุรกิจ
  • วิทยาศาสตร์ข้อมูล
  • การตลาดดิจิทัล

  • ตลาดการค้า
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button