2025年11月17日月曜日

登山できないのでAIプログラミング

 


クマの大量出没によって、平地でも被害が多発。
自分の住んでいるところの周りでも、たくさん出ている。
これでは、とても登山はできないので、面白くない。しかし行けばクマにやられる可能性はかなり大きいと思う。


そこで、昔やっていたプログラムの知識を応用して、AIにいろいろとプログラムを作ってもらい、直すべきところは直したりしていた。
Zennという技術系blogにも何か書いたりしていた。

今の技術は昔とは比べ物にならないほど、進展していることを改めて感じた。

すこしの知識があれば、小さな会社が何週間もかけて作るようなシステムを、個人でも作れるレベルであることは間違いない。

改めて「AI革命」の現実に触れた。

今回は、ある「ニッチな言語」の翻訳をGemini APIで実行するプログラムを作成するのにAIを利用した。これが英語等のメジャーな言語であれば、AIを使わなくても簡単に翻訳可能であるが、ほとんど使われていない言語の場合、これまでは手動で翻訳するしか方法がなかったのである。
現在はRAG(Retrieval-Augmented Generation、検索拡張生成)を用いて、Llama-Indexという辞書をAIに検索させながら、翻訳することが可能になっている。


これは、専門的な論文などを翻訳するのにも、とても有効だ。
これにより、AIがでたらめな回答を生成する、いわゆるハルシネーションを劇的に減らすことができるようになり、実用レベルの翻訳を作ることができるようになった。

GeminiのようなLLM(大規模言語モデル)は、数兆ものパラメーター(単語のようなものであるが、すべて多次元配列として数値化されている)をもち、インターネット上の情報を、ほとんどすべて、読み込んでいる。
特にGeminiは言語のカバー範囲が広く、かなりマイナーな言語でも、情報を持っている可能性が高い。

マイナーな言語に関しては、Geminiは他の追随を許さず、たぶん世界一の性能を持っている。

ChatGPTやClaudeなど、他にもLLMはたくさん存在するが、Geminiの性能は、一つ飛びぬけている、と感じた。