สถาบันนวัตกรรมเทคโนโลยีแห่งสหรัฐอาหรับเอมิเรตส์ พลิกโฉมแบบจำลองภาษาด้วยสถาปัตยกรรมใหม่

Logo

• Falcon Mamba 7B เป็นแบบจำลองภาษาระดับโลกที่มีประสิทธิภาพสูงสุดในหมวดหมู่ SSLM แบบเปิด (Open Source State Space Language Model) โดยได้รับการยืนยันจาก Hugging Face

• SSLM มีค่าใช้จ่ายด้านหน่วยความจำต่ำ และไม่ต้องใช้หน่วยความจำเพิ่มเติมในการสร้างข้อความยาวๆ ตามต้องการ

• Falcon Mamba 7B มีประสิทธิภาพดีกว่าแบบจำลองสถาปัตยกรรม Transformer แบบดั้งเดิม เช่น Llama 3.1 8B ของ Meta และ Mistral 7B

แบบจำลองใหม่นี้สะท้อนถึงความคิดริเริ่มและนวัตกรรมของอาบูดาบีในด้านการวิจัยและพัฒนา AI

อาบูดาบี สหรัฐอาหรับเอมิเรตส์–(BUSINESS WIRE)–12 สิงหาคม 2024

สถาบันนวัตกรรมเทคโนโลยี  (TII) ซึ่งเป็นศูนย์วิจัยวิทยาศาสตร์ชั้นนำระดับโลกและเสาหลักของการวิจัยประยุกต์ของสภาวิจัยเทคโนโลยีขั้นสูงแห่งอาบูดาบี (Advanced Technology Research Council) (ATRC) ได้เปิดตัวโมเดลภาษาขนาดใหญ่รุ่นใหม่ในซีรีส์ Falcon ชื่อว่า Falcon Mamba 7B โมเดลนี้เป็น State Space Language Model (SSLM) แบบโอเพนซอร์สอันหนึ่งของโลก โดยได้รับการยืนยันจาก Hugging Face

UAE’s Technology Innovation Institute Revolutionizes AI Language Models With New Architecture (Photo: AETOSWire)

สถาบันนวัตกรรมเทคโนโลยีของ UAE ปฏิรูปโมเดลภาษา AI ด้วยสถาปัตยกรรมใหม่ (ภาพ: AETOSWire)

ในฐานะที่เป็น SSLM รุ่นแรกสำหรับซีรีส์ Falcon ทำให้โมเดลนี้แตกต่างจากโมเดล Falcon รุ่นก่อนหน้าทั้งหมดที่ใช้สถาปัตยกรรมแบบ Transformer ซึ่ง Falcon Mamba 7B รุ่นใหม่นี้เป็นอีกหนึ่งตัวอย่างหนึ่งของการวิจัยบุกเบิกที่สถาบันกำลังดำเนินการ ตลอดจนเครื่องมือและผลิตภัณฑ์ล้ำสมัยที่สถาบันเปิดให้ชุมชนเข้าถึงได้ในรูปแบบโอเพนซอร์ส

Faisal Al Bannai เลขาธิการ ATRC และที่ปรึกษาประธานาธิบดี UAE ด้านการวิจัยเชิงกลยุทธ์และกิจการเทคโนโลยีขั้นสูง กล่าวว่า “Falcon Mamba 7B ถือเป็นโมเดล AI อันดับหนึ่งต่อเนื่องเป็นรุ่นที่สี่ของ TII ซึ่งเสริมสร้างให้อาบูดาบีเป็นศูนย์กลางระดับโลกด้านการวิจัยและพัฒนา AI ความสำเร็จนี้เป็นข้อพิสูจน์ถึงความมุ่งมั่นอย่างไม่หยุดยั้งของ UAE ในด้านนวัตกรรม”

สำหรับโมเดลสถาปัตยกรรม Transformer Falcon Mamba 7B มีประสิทธิภาพดีกว่า Llama 3.1 8B, Llama 3 8B ของ Meta และ Mistral 7B ในเกณฑ์มาตรฐานใหม่จาก HuggingFace ในขณะที่ SSLM อื่นๆ Falcon Mamba 7B มีประสิทธิภาพดีกว่าโมเดลโอเพนซอร์สทั้งหมดในเกณฑ์มาตรฐานเก่า และจะเป็นโมเดลแรกในตารางผู้นำเกณฑ์มาตรฐานใหม่ที่เข้มงวดกว่าของ HuggingFace

ดร. Najwa Aaraj ประธานเจ้าหน้าที่บริหารของ TII กล่าวว่า “สถาบันนวัตกรรมเทคโนโลยียังคงผลักดันขีดจำกัดของเทคโนโลยีด้วยโมเดล AI ซีรีส์ Falcon Falcon Mamba 7B เป็นผลงานบุกเบิกที่แท้จริงและปูทางไปสู่นวัตกรรม AI ในอนาคตที่จะเสริมสร้างความสามารถของมนุษย์และพัฒนาคุณภาพชีวิต”

โมเดล State Space มีประสิทธิภาพสูงมากในการทำความเข้าใจสถานการณ์ที่ซับซ้อนซึ่งพัฒนาไปตามเวลา เช่น การอ่านหนังสือทั้งเล่ม เนื่องจาก SSLM ไม่ต้องการหน่วยความจำเพิ่มเติมในการประมวลผลข้อมูลขนาดใหญ่เช่นนี้

ในทางกลับกัน โมเดลที่ใช้สถาปัตยกรรม Transformer มีประสิทธิภาพสูงมากในการจดจำและใช้ข้อมูลที่เคยประมวลผลไว้ก่อนหน้านี้ในลำดับ ทำให้โมเดลพวกนี้เหมาะสมกับงานอย่างการสร้างเนื้อหา อย่างไรก็ตาม เนื่องจากพวกมันเปรียบเทียบทุกคำกับทุกคำอื่นๆ จึงต้องใช้พลังการคำนวณอย่างมาก

SSLM สามารถนำไปใช้ในหลายสาขา เช่น การประเมิน การพยากรณ์ และงานควบคุม เช่นเดียวกับโมเดล Transformer โมเดลพวกนี้ยังมีความเชี่ยวชาญในงานประมวลผลภาษาธรรมชาติ และสามารถนำไปใช้ในการแปลภาษา สรุปข้อความ การประมวลผลภาพ และเสียงได้อีกด้วย

ดร. Hakim Hacid หัวหน้าฝ่ายวิจัยชั่วคราวของหน่วย AI Cross-Center ของ TII กล่าวว่า “เมื่อเราเปิดตัว Falcon Mamba 7B ผมรู้สึกภูมิใจในระบบนิเวศการทำงานร่วมกันของ TII ที่สนับสนุนการพัฒนาแบบจำลองนี้ การเปิดตัวครั้งนี้เป็นก้าวสำคัญที่สร้างแรงบันดาลใจให้เกิดมุมมองใหม่ๆ และกระตุ้นการค้นหาระบบอัจฉริยะอย่างต่อเนื่อง ที่ TII เรากำลังผลักดันขีดจำกัดของทั้งแบบจำลอง SSLM และ Transformer เพื่อจุดประกายนวัตกรรมเพิ่มเติมในด้าน AI เชิงสร้างสรรค์”

โมเดล LLM ของ Falcon ถูกดาวน์โหลดไปแล้วกว่า 45 ล้านครั้ง ซึ่งพิสูจน์ถึงความสำเร็จที่ยอดเยี่ยมของโมเดลเหล่านี้ Falcon Mamba 7B จะเปิดตัวภายใต้ใบอนุญาต TII Falcon 2.0 ซึ่งเป็นใบอนุญาตซอฟต์แวร์ที่อนุญาตตามแบบ Apache 2.0 ที่มีกฎการใช้งานที่ยอมรับได้ซึ่งส่งเสริมการใช้ AI อย่างมีความรับผิดชอบ ข้อมูลเพิ่มเติมเกี่ยวกับโมเดลใหม่สามารถดูได้ที่ FalconLLM.TII.ae

สามารถรับชมภาพในรูปแบบมัลติมีเดียได้ที่: https://www.businesswire.com/news/home/54107705/en

*ที่มา: AETOSWire

เนื้อหาใจความในภาษาต้นฉบับของข่าวประชาสัมพันธ์ฉบับนี้เป็นฉบับที่เชื่อถือได้และเป็นทางการ การแปลต้นฉบับนี้จึงมีจุดประสงค์เพื่ออำนวยความสะดวกเท่านั้น และควรนำไปเทียบเคียงอ้างอิงกับเนื้อหาในภาษาต้นฉบับ ซึ่งเป็นฉบับเดียวที่มีผลทางกฎหมาย

ติดต่อ

Jennifer Dewan ผู้อำนวยการอาวุโสฝ่ายสื่อสาร
Jennifer.dewan@tii.ae

ที่มา: The Technology Innovation Institute

.