【AI】アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

1: ななしのAIさん 2024/03/18(月) 21:16:10.90
 アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。

一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮
 複数(30億、70億、300億)のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。

各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2(画像理解)、TextVQA(画像内のテキスト情報)、ScienceQA(科学知識)、MMBench(マルチモーダル)、MathVista(数学)などのベンチマークで強力なパフォーマンスを示している。

 また、両モデルはMoE(Mixture-of-Experts:複数の専門家モデルを組み合わせ、効率的に処理ができるアーキテクチャ)モデルも試されており、いずれも通常のモデルよりも優れた性能を発揮している。

 さらに、300億パラメーターモデルでは、VQAv2(画像理解)ベンチマークにおいてグーグルの「Gemini Pro」「Gemini Ultra」、そしてOpenAIの「GPT-4V」に勝るスコアを示している。
https://ascii.jp/elem/000/004/189/4189761/

16: ななしのAIさん 2024/03/19(火) 08:12:36.30
>>1、これからのPCやスマホは学習機能付き?

2: ななしのAIさん 2024/03/18(月) 21:18:05.21
M/M/1って待ち行列理論で
それつかった無人レジとか、失敗くさいで撤去されてない?

4: ななしのAIさん 2024/03/18(月) 21:26:05.28
じゃあなんでGoogleと提携するとか言ってんだ

5: ななしのAIさん 2024/03/18(月) 21:28:02.78
問題は人口無能。考えているわけではない。

9: ななしのAIさん 2024/03/18(月) 21:47:10.68
>>5
リトルの公式だ
俺の尻の穴がどうかしたのか?

10: ななしのAIさん 2024/03/18(月) 22:34:50.88
>>9
test’ or ‘1’=‘1’

11: ななしのAIさん 2024/03/18(月) 22:40:27.86
これもnvidia だよりなんか?

12: ななしのAIさん 2024/03/18(月) 22:44:00.69
今日はAAPLもGOOGLも上がってくれて
協業発表の効果かな

13: ななしのAIさん 2024/03/18(月) 22:50:34.82
協業というよりはAppleが頭下げてGoogleのAIを売ってもらう

14: ななしのAIさん 2024/03/18(月) 23:22:53.82
俺のMacBook Proの出番だな。

15: ななしのAIさん 2024/03/19(火) 07:39:11.19
イルカの親戚だろ
どうせ

17: ななしのAIさん 2024/03/19(火) 12:26:50.76
後出しなんだから性能はいいよね

19: ななしのAIさん 2024/03/19(火) 15:37:17.13
周回遅れやろ

20: ななしのAIさん 2024/03/19(火) 19:58:25.82
競争に参加できない国もあるとか

引用元:https://anago.2ch.sc/test/read.cgi/bizplus/1710764170/