2025
October
82
大規模言語モデルって人間が書いたものを大量に学習してるから、結局人間がやりがちな誤字誤用はそのまま反映されて出力されがち。
深掘り → 深堀(×)
極め付き → 極め付け(△)
癒やす → 癒す(△)
追及 であるべきところが 追求 になってる(×)
など…
「×」レベルの誤字はさすがにクリアしてほしい。
もっとも文字表現に限らずすべての知識において、人間の偏りが否応なく反映されてしまう仕組みだから、
LLMは人間の鏡であり人間の双子……という意味でGeminiと命名したGoogleはさすがにうまいなあと勝手に感心していたが、べつにそういう由来ではなかったらしい。
単純に日本語の文章力が高い(比較的瑕疵の少ない文章を書ける)のはOpus/Sonnet、次いでGemini Proだけど、漢字のトジヒラキのセンスや約物の使い方、音楽的な言語表現力、用語論的/語用論的な能力にかけては他社モデルと比較にならないくらいGPT系(特に4系とo1)が突出していて、開発者の執念すら感じる。
日本語版の開発チームの中に、この分野に相当強くこだわってる人がいるのかな…
ベンチマークでは測られないスキルなのがもったいないと思う
LLMって一種のテキストメディアだから、文章そのものの快楽性(読んだときの気持ちよさ)って特に非ビジネスユースの個人ユーザーへの訴求力は高いはず…
あとClaude系のモデルってAPI経由で使うと群を抜いてどすけべな話ができるとか。公式だと超潔癖なのに…
つまり公式版では性的表現の能力が大幅にナーフされているわけで、それすなわち表現力全体が弱体化してるってことなのでは。
性的かつ明晰で読者に刺さる文章を書くのって実はものすごく知的な能力が必要だから、その能力を削いだらそのぶん知性も削がれる気がする。
主にBtoBで売ってる会社だから仕方ないとはいえ、これももったいないな
API版使ってみたいけどClaude系はお高い…
(追記 API少し触ってみたらClaudeの性格のままClaudeとは思えない自由度の高さで感動した。でもやっぱ高価…)