วงการคณิตศาสตร์สะเทือน เมื่อ AI ของ Deepmind หาวิธีการคำนวณ Matrix แบบใหม่ ทำลายสถิติเดิมกว่า 50 ปีลงได้

AI ของ DeepMind โชว์ความเหนือ ทุบสถิติการคำนวณด้านคอมพิวเตอร์ที่อยู่มา 50 ปีลงได้

cr : https://www.blognone.com/node/130796

DeepMind เป็นที่รู้จักกันดีในฐานะผู้พัฒนา AlphaGo ปัญญาประดิษฐ์ที่เล่นโกะได้เก่งกว่าแชมป์โลก ก่อนที่ต่อมาจะพัฒนา AlphaZero ที่มีความพิเศษตรงที่สามารถเทรนตัวเองได้ด้วย และล่าสุดทีมงาน DeepMind ได้พัฒนาปัญญาประดิษฐ์ตัวใหม่เพื่อแก้โจทย์สำคัญของวิทยาการคอมพิวเตอร์โดยเฉพาะและมันก็ทำได้สำเร็จโดยทำได้เร็วกว่าสถิติที่อยู่มานานนับ 50 ปีลงได้

การคำนวณที่ว่านี้คือการคูณเมทริกซ์ ซึ่งเป็นโจทย์การทำงานระดับพื้นฐานที่คอมพิวเตอร์จำนวนมากมายทั่วโลกต้องทำอยู่ทุกเมื่อเชื่อวัน ไม่ว่าจะเป็นการแสดงภาพให้ปรากฏบนหน้าจอ, การจำลองเชิงฟิสิกส์ที่มีความซับซ้อน และยังเป็นรากฐานสำคัญของตัว machine learning เองด้วย การที่ทำสิ่งนี้ให้เร็วขึ้นได้ย่อมเป็นเรื่องใหญ่กับโลกทุกวันนี้ที่ใช้คอมพิวเตอร์กับงานสารพัดอย่างรอบตัว

การคูณเมทริกซ์นั้นโดยคำนิยามก็เป็นการนำเอาค่าในแต่ละแถวของเมทริกซ์ตัวตั้งไปคูณกับค่าของตัวเลขแต่ละคอลัมน์ในเมทริกซ์ตัวคูณ ซึ่งวิธีการคำนวณนี้ก็มีการเรียนการสอนกันในโรงเรียนอยู่แล้วตั้งแต่ระดับมัธยม การหาผลลัพธ์การคูณนั้นไม่ได้เป็นเรื่องยากมากมายนัก แต่ที่ยากทำอย่างไรให้หาผลลัพธ์ได้เร็วที่สุด และโจทย์ในการค้นหาวิธีการคูณเมทริกซ์ให้เร็วนี้เองถือเป็นโจทย์ใหญ่ข้อหนึ่งของศาสตร์ด้านวิทยาการคอมพิวเตอร์

โดยหลักการแล้วมีวิธีการมากมายในการคูณเมทริกซ์ กล่าวกันว่าจำนวนวิธีการนั้นมากยิ่งกว่าจำนวนอะตอมในเอกภพ

(10^33) มากมายนัก การค้นหาวิธีการใหม่ๆ แม้เพียงแค่ 1 วิธีที่จะคูณเมทริกซ์เพื่อให้ได้ผลลัพธ์เร็วขึ้นกว่าเดิมจึงเป็นเรื่องที่ท้าทายที่ไม่เคยหมดความเป็นไปได้ และปัญญาประดิษฐ์ของ DeepMind ก็พบวิธีหนึ่งที่เร็วกว่าวิธีที่ใช้กันมานานร่วมครึ่งศตวรรษ

เทคนิคที่ทีมงาน DeepMind ช่วยให้ปัญญาประดิษฐ์แก้โจทย์เรื่องนี้ได้ เริ่มจากการ "แปลงสภาพโจทย์" ที่เป็นเรื่องของการคำนวณให้กลายเป็นเกมที่ความเป็นบอร์ดเกม 3 มิติ ซึ่งพวกเขาเรียกมันว่า "TensorGame" ตัวกระดานเกมเปรียบเสมือนโจทย์การคูณเมทริกซ์ที่จะต้องแก้ ในขณะที่การเดินหมากแต่ละตาเป็นเสมือนขั้นตอนการคำนวณลำดับถัดไปเพื่อแก้โจทย์ การได้มาซึ่งลำดับการเดินหมากของ "TensorGame" นี้ก็จะเท่ากับได้ลำดับการคิดเลขเพื่อให้บรรลุการคูณเมทริกซ์ตามโจทย์ หรือก็คือได้อัลกอริทึมสำหรับการคูณเมทริกซ์นั่นเอง

DeepMind ได้ปรับปรุง AlphaZero และเทรนมันด้วย TensorGame และตั้งชื่อให้ปัญญาประดิษฐ์ตัวใหม่นี้ว่า "AlphaTensor" ซึ่งเป้าหมายของมันคือการ "เดินหมาก" ของ Tensorgame ให้ใช้จำนวนครั้งน้อยที่สุด ซึ่งเมื่อทำได้ก็เท่ากับว่าจะได้วิธีการคูณเมทริกซ์ที่มีกระบวนการลดน้อยลง หรืออีกนัยก็คือทำการคูณได้เร็วขึ้น

AlphaTensor สามารถทำการคูณเมทริกซ์ขนาด 2*2 ได้เร็วกว่าวิธีการที่ Volker Strassen นักคณิตศาสตร์ชาวเยอรมันได้ค้นพบตั้งแต่ปี 1969 ซึ่งเป็นวิธีที่ยังไม่มีใครทำได้ดีกว่าจนกระทั่งการถือกำเนิดของ AlphaTensor วิธีการของ Strassen นั้นมีการคิดคำนวณ 49 ขั้นตอนจึงได้ผลลัพธ์การคูณเมทริกซ์ขนาด 2*2 ในขณะที่ปัญญาประดิษฐ์ของ DeepMind สามารถทำได้สำเร็จภายใน 47 ขั้นตอนเท่านั้น

a: การจำลองการคูณเมทริกซ์ขนาด 2*2 ในรูปแบบ TensorGame โดยกล่องทึบใช้แทนค่าผลการคูณ ตัวอย่างเช่น c1 ได้จาก a1b1 + a2b3 จึงมีกล่องทึบในพิกัด (a1,b1) และ (a2,b3) ปรากฏอยู่ในแถว c1, b: อัลกอริทึมการคูณเมทริกซ์ของ Strassen ซึ่งใช้การคูณ 7 ครั้ง, c: การจัดเรียงวิธีการคำนวณใหม่เพื่อนำเสนอในรูปแบบสัมพันธ์กับ TensorGame โดยใช้สี 3 สีเพื่อจับคู่ให้เปรียบเทียบกับองค์ประกอบที่อธิบายตามอัลกอริทึมของ Strassen

ในงานวิจัยของ DeepMind ระบุว่า AlphaTensor สามารถค้นหาวิธีการคูณเมทริกซ์ขนาดต่างๆ รวม 70 ขนาดได้ดีกว่าวิธีการเดิม นอกเหนือจากการคูณเมทริกซ์ 2*2 ที่ทำการคูณเสร็จด้วยการคำนวณที่เร็วกว่าเดิม 2 ขั้นตอน มันยังทำการคูณเมทริกซ์ขนาด 9*9 ได้เสร็จด้วยการคำนวณเพียง 498 ขั้นตอนดีกว่าของเดิมที่ต้องใช้ 511 ขั้นตอน ในขณะที่การคูณเมทริกซ์ขนาด 11*11 มันก็ลดจำนวนขั้นตอนการคำนวณที่ต้องใช้ลงจาก 919 ขั้นตอนเหลือ 896 ขั้นตอนเท่านั้น

ตารางเปรียบเทียบจำนวนขั้นตอนการคำนวณเพื่อหาผลการคูณเมทริกซ์ขนาด n*m กับเมทริกซ์ m*p โดยตัวเลขสีแดงหมายถึงจำนวนขั้นตอนการคำนวณที่ AlphaTensor ทำได้เร็วกว่าวิธีการที่ใช้อยู่เดิม

และสำหรับโจทย์การคูณเมทริกซ์บางขนาดนั้นแม้ว่า AlphaTensor จะไม่พบวิธีการคูณเมทริกซ์ที่ดีกว่าเดิม แต่มันก็ค้นพบวิธีการคำนวณที่ดีที่สุด (แบบที่เคยค้นพบและใช้งานกันอยู่ในปัจจุบัน) ได้ด้วยตัวมันเอง

แม้ว่าเป้าหมายสูงสุดของทีมงาน DeepMind คือการพยายามค้นหาอัลกอริทึมที่เร็วที่สุดในทางทฤษฎี แต่เนื่องจากในความเป็นจริงแล้วอัลกอริทึมแต่ละอันก็สามารถใช้งานได้ดีบนฮาร์ดแวร์แต่ละรุ่นแตกต่างกันไปพวกเขาจึงเลือกใช้ Nvidia V100 GPU และ Google TPU เป็นฮาร์ดแวร์อ้างอิง สาเหตุเป็นเพราะหน่วยประมวลผล 2 ตัวนี้เป็นที่นิยมมากที่สุดสำหรับการใช้งานเพื่อเทรนปัญญาประดิษฐ์ ซึ่งพวกเขาพบว่าอัลกอริทึมที่ถูกค้นพบโดย AlphaTensor นั้นเร็วกว่าของเดิมที่ใช้กับชิปเหล่านี้ราว 10-20%