Wikimedia ทำให้ข้อมูลเป็นมิตรกับ AI

Wikimedia ทำให้ข้อมูลเป็นมิตรกับ AI โดยการเปิดตัวโครงการใหม่ที่ช่วยให้โมเดลปัญญาประดิษฐ์เข้าถึงฐานความรู้ขนาดใหญ่ได้ง่ายขึ้น Wikimedia ซึ่งเป็นองค์กรไม่แสวงหาผลกำไรที่อยู่เบื้องหลัง Wikipedia และเว็บไซต์ในเครืออย่าง Wikimedia Commons และ Wikidata ได้ตัดสินใจปรับปรุงข้อมูลให้เหมาะสมกับเทคโนโลยี AI ในยุคปัจจุบัน

Wikimedia ทำให้ข้อมูลเป็นมิตรกับ AI อย่างไร

องค์กร Wikimedia Deutschland ซึ่งเป็นสาขาในเยอรมนีของ Wikimedia ได้เปิดตัวโครงการ Wikidata Embedding Project โครงการนี้จะนำข้อมูลเปิดประมาณ 120 ล้านรายการจาก Wikidata มาทำให้อยู่ในรูปแบบที่โมเดลภาษาขนาดใหญ่ (Large Language Models) สามารถใช้งานได้สะดวกยิ่งขึ้น แม้ว่าข้อมูลใน Wikidata จะเป็นโครงสร้างที่เครื่องจักรอ่านได้อยู่แล้ว แต่ยังไม่เข้ากันได้โดยตรงกับระบบ AI สร้างสรรค์ที่ทำงานกับภาษาธรรมชาติ

โครงการนี้ทำงานโดยการแปลงรายการใน Wikidata ให้เป็นเวกเตอร์ ซึ่งเป็นพิกัดตัวเลขที่แสดงความสัมพันธ์ระหว่างข้อความต่างๆ ลองนึกภาพเหมือนแผนที่ที่คำที่เกี่ยวข้องกัน เช่น “สุนัข” และ “ลูกหมา” จะรวมกลุ่มใกล้กัน ในขณะที่คำที่ไม่เกี่ยวข้อง เช่น “สุนัข” และ “บัญชีธนาคาร” จะอยู่ห่างไกลกัน สิ่งนี้ช่วยให้ระบบ AI เข้าใจบริบทของคำและประมวลผลภาษาธรรมชาติได้มีประสิทธิภาพมากขึ้น

ประโยชน์ของโครงการ Wikidata Embedding

Wikimedia Deutschland ระบุในแถลงการณ์ว่า โครงการนี้มุ่งให้ข้อมูลคุณภาพสูงแก่โมเดล AI เพื่อสร้างคำตอบที่เชื่อถือได้มากขึ้น โดยส่วนใหญ่ระบบ AI ปัจจุบันพึ่งพาชุดข้อมูลที่ไม่โปร่งใส โครงการนี้ยังช่วยสร้างความเท่าเทียม โดยทำให้ข้อมูล Wikidata ซึ่งเป็นข้อมูลเปิด สามารถเข้าถึงได้ฟรี เพื่อให้บริษัท AI ขนาดเล็กแข่งขันกับยักษ์ใหญ่อย่างเทคโนโลยีชั้นนำที่อาจมีทรัพยากรในการแปลงข้อมูลเอง

“การเปิดตัวโครงการ embedding แสดงให้เห็นว่าปัญญาประดิษฐ์ที่ทรงพลังไม่จำเป็นต้องถูกควบคุมโดยบริษัทเพียงไม่กี่แห่ง แต่สามารถพัฒนาได้อย่างเปิดกว้างและร่วมมือกัน” Philippe Saadé ผู้จัดการโครงการ AI ของ Wikidata กล่าว

Wikimedia Deutschland เริ่มพัฒนาโครงการนี้ตั้งแต่เดือนกันยายน 2024 โดยร่วมมือกับ Jina AI ซึ่งสร้างระบบ embedding ที่แปลงรายการ Wikidata เป็นเวกเตอร์ และ IBM’s DataStax ซึ่งเก็บเวกเตอร์เหล่านั้นในฐานข้อมูลของตน

บริบทกับการแข่งขันจาก Elon Musk

การเปิดตัวโครงการนี้เกิดขึ้นเพียงวันเดียวหลังจาก Elon Musk โพสต์บน X ว่าเขากำลังสร้างคู่แข่ง Wikipedia ชื่อ Grokipedia “เรากำลังสร้าง Grokipedia @xAI” Musk เขียน “จะเป็นการปรับปรุงครั้งใหญ่จาก Wikipedia จริงๆ แล้ว มันเป็นขั้นตอนที่จำเป็นต่อเป้าหมายของ xAI ในการเข้าใจจักรวาล”

Musk มักวิจารณ์ Wikipedia ว่าเป็น “Wokipedia” และบ่นว่าขาดทางเลือกที่สอดคล้องกับมุมมองทางขวา เขายังรีโพสต์ Larry Sanger ผู้ร่วมก่อตั้ง Wikipedia ที่ลาออกในปี 2002 และพยายามเปิดโครงการคู่แข่งหลายครั้ง Sanger ซึ่งเป็นนักวิจารณ์ Wikipedia จากฝั่งขวา โพสต์เมื่อเร็วๆ นี้ว่าการพึ่งพาข้อมูล AI ที่มีคุณภาพและอคติต่ำจะมีอิทธิพลต่อสิ่งที่ผู้คนนับล้านเชื่อว่าเป็นความจริง

การพยายามสร้างสารานุกรมคู่แข่งที่เต็มไปด้วยข้อเท็จจริงที่ Musk ชอบ ยิ่งเน้นย้ำว่าทำไม Wikimedia ถึงเปิดโครงการ AI ของตัวเอง ในขณะที่ AI กำลังแพร่หลาย คุณภาพและอคติของข้อมูลที่ระบบเหล่านี้พึ่งพาจะกำหนดทิศทางความรู้ของสังคม

โครงการนี้ไม่เพียงช่วยพัฒนา AI ที่โปร่งใส แต่ยังส่งเสริมการเข้าถึงข้อมูลอย่างเท่าเทียม คุณคิดอย่างไรกับการเคลื่อนไหวนี? ลองแชร์ความเห็นในความคิดเห็นด้านล่าง และอย่าลืมติดตามอัปเดตเกี่ยวกับเทคโนโลยี AI และข้อมูลเปิด

ที่มา – Wikimedia Is Making Its Data AI-Friendly

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *