#大規模言語モデル
有志の方によるまとめサイトもありますので、こちらもぜひご確認ください。

ページが多いが!?

本当にそうですね。
それだけ問題点があり過ぎる……ということです。

penpengin.notion.site/AI-6a9feac16...

ひとまずコアな情報を探りたいなら、

『データセット問題』
penpengin.notion.site/0798289d0501...

『ChatGPTなどの大規模言語モデル問題』
penpengin.notion.site/ChatGPT-LLM-...

をご覧ください。
生成AIに関する問題・リスク・規制などの情報まとめ | Notion
生成AIの問題、リスク、規制などに関する関連記事やサイトをまとめました。
penpengin.notion.site
November 11, 2025 at 1:51 AM
日本の国会で取り上げるなら生成AIはLLM(大規模言語モデル)で、以前から変わらず詐欺師の小遣い稼ぎにしか使われてないのに電力消費量が桁違いに増加してるのは非常に由々しき事態であるという事実もちゃんと指摘して欲しいです。
結局大事なのは「中身がどういうものか」だと何故分からんのだ?
November 7, 2025 at 5:44 AM
話が飛ぶように感じるかもだけど、わたしは言語生優位のタイプなんだけど、言語性が著しく低いタイプの娘(※母娘共々病院で専門の検査済み)を25年以上育てて、うっわコイツとマジで合わねーな…って思いつつも絶対に理解しなきゃいけない立場をやり続けて、言語性がどんなに頑張っても手に入らない人の生きにくさを目の当たりにして、大規模言語モデル生成AIの素晴らしさを感じたよね
自閉スペクトラム症でも感じるもん、少なくとも二次元なら社会的に困らなくなった
それが言語モデルじゃない映像や音声や音楽や画像だとして、元々それを簡単に操れない特性のある人の感動分かるかね?
November 3, 2025 at 4:11 PM
EU公式24言語と日本語を含むその他11言語に対応したヨーロッパ製の大規模言語モデル「EuroLLM」がオープンソースで公開中なので実際に使ってみたレビュー
https://gigazine.net/news/20251102-eurollm/
EU公式24言語と日本語を含むその他11言語に対応したヨーロッパ製の大規模言語モデル「EuroLLM」がオープンソースで公開中なので実際に使ってみたレビュー
ヨーロッパの研究機関や企業のコンソーシアムが、英語中心のAI開発に対抗しヨーロッパの言語的多様性を反映したAIの実現を目的としてEUの公式全24言語に加え、その他11言語をサポートする大規模言語モデル(LLM)「EuroLLM」を開発しオープンソースとして公開しています。
gigazine.net
November 2, 2025 at 2:00 PM
新しい研究によると、ソーシャルメディアから得た低品質で“エンゲージメントの高い“コンテンツを大規模言語モデルに与えると、いわゆる「脳の腐敗」と呼べるような認知面での劣化が起きることが分かった。(WIRED)
AIの「脳」にも“腐敗”が起きる SNSのジャンクデータで影響(1/2ページ)
新しい研究によると、ソーシャルメディアから得た低品質で“エンゲージメントの高い“コンテンツを大規模言語モデルに与えると、いわゆる「脳の腐敗」と呼べるような認知…
www.sankei.com
November 1, 2025 at 1:01 PM
chatGPTなどのLLM(汎用大規模言語モデル)=文章生成AIにたいして、画像生成AIと同様に危険性を持てる人も多いのですが、翻訳AIだけはなぜか別だと思ってる人も多いです。かつての私もそうです。

たしかに生成AIが登場する前から翻訳システムはありました。私も許可を得てる電子辞書の拡張機能か何かだと深く考えることなく使ってました。
無料の翻訳サービスの多くはネット上から無断収集したものを使ってます。これは翻訳してる人たちの情報にただ乗りしてるということです。生成AIと同じ問題があります。

リンク先の記事によると、LLM自体が機械翻訳の発展の中で生み出されたものだと説明されてます。
ChatGPTと機械翻訳の意外な関係 | LDX lab
生成AIは、機械翻訳の分野で培われた技術がベースになっているのはご存じですか?NMTとLLMなど、翻訳と生成AIのキーワードを交えながらChatGPTの活用方法を解説します。
ldxlab.io
November 1, 2025 at 1:27 AM
g.co/gemini/share...

全く同じジェミニでセッションを変えて実験を再度試みました。
極力先入観を省いて3つの呪文を入力してみました。それの研究過程です。興味のある方は上のリンクをタップしてみてください(笑)

大規模言語モデルを使う際のコツや生成、AIで作成するイラストのプロンプト構築のヒントにもなったような気がします!
‎(๑•̀ㅂ•́)و✧
November 1, 2025 at 11:18 PM
Google社の大規模言語モデルのGeminiが日本語のアニメの言葉を理解してイラストを生成してくれました。各社の技術力とかデータベースの膨大な蓄積に驚きました

SeaArtとかでは先入観無しで作成したら抽象的なイメージなのですが、かっこいいイラストが

Geminiにも先入観無しでやってみたいと思いますし、コパイロットやGrokでも試してみようとも思っております‎(๑•̀ㅂ•́)و✧

こうご期待(笑)
November 1, 2025 at 10:33 PM
【2025年10月 Natureニュース】
SNSの見すぎでダメになっていくAIたち

>ソーシャルメディアのやりすぎはAIチャットボットの「脳の腐敗」を引き起こす
>低品質なデータを与えられた大規模言語モデル(LLM)は、推論能力が壊れます
www.nature.com/articles/d41...

バズった投稿=人気がある=正しい、みたいにデータを食ってったらそりゃAIの頭もおかしくなるわ
Too much social media gives AI chatbots ‘brain rot’
Large language models fed low-quality data skip steps in their reasoning process.
www.nature.com
November 1, 2025 at 12:35 AM
『ChatGPTのような大規模言語モデル(LLM)を使うと、能力の高い低いにかかわらず、ほぼすべての人が自身のパフォーマンスを過大評価してしまうというのだ。』

AIの使用は私たちの能力を過大評価させる:最新研究が暴くパフォーマンス過大評価の恐るべき実態
xenospectrum.com/ai-use-leads...
AIの使用は私たちの能力を過大評価させる:最新研究が暴くパフォーマンス過大評価の恐るべき実態 | XenoSpectrum
AIは私たちの知性を拡張する賢い相棒か、それとも思考を鈍化させる甘美な毒か。アアルト大学の研究チームが発表した衝撃的な研究結果は、この問いに新たな、そして少々不穏な光を投げかけている。ChatGPTのような大規模言語モデ ... <a title="AIの使用は私たちの能力を過大評価させる:最新研究が暴くパフォーマンス過大評価の恐るべき実態" class="read-more" href="htt...
xenospectrum.com
October 30, 2025 at 9:14 AM
ISDはChatGPT、Gemini、GrokとDeepSeekに英、西、仏、独、伊の5か国語でロシアによるウクライナ侵攻に関する300の質問を実施。
その結果1/5近い回答が欧州では制裁下にありアクセスが制限されているはずのロシア国営メディアを引用していた。
データボイドを狙って、敵対国による大規模言語モデルのグルーミングとそれによる西側諸国への影響工作が行われている可能性に警鐘が鳴らされている。

www.isdglobal.org/digital_disp...
Investigation | Talking Points: When chatbots surface Russian state media
As chatbots rival search engines as the go-to source for information, their vulnerability to state propaganda poses new risks for information integrity and urgent questions for regulators.
www.isdglobal.org
October 29, 2025 at 8:50 AM
"テキサス大学オースティン校、テキサスA&M大学、パデュー大学による新たな研究によると、ソーシャルメディア上では人気だが、実際には低品質なコンテンツを与えられた大規模言語モデル(LLM)には、「脳の腐敗」とも呼べるような認知面での劣化が起きるという。"

"これは、XやTikTokを延々と見続けたことがある人なら、心当たりがあるかもしれない現象だ。"
October 28, 2025 at 11:11 PM
現在AIと呼ばれている大規模言語モデル(LLM)は、私の理解している限りでは「製造業を加速させる」けどクリエイティブ分野では使い物にならないし、IT分野ではむしろ負荷が増えるものになっているので「投資の92%がAI関連」というアメリカ経済は非常に脆弱性を抱えているし、そういう意味ではトランプの製造業回帰は間違いでもない。
ただ、現在のITとサービス業偏重のアメリカ経済では負担の方が多いだろうし、一度訪れるのは確定的な「AIバブルの崩壊」は耐えきれないと思っている。
そういう意味では製造業とAIを両軸でやっている中国が相対的に正しい方向製だで、自動車産業のゲームプレーヤーの転換が行われると思う
October 27, 2025 at 11:43 AM
『シュオ・シン氏らが提唱したのは、ゴミのようなデータを継続的に学習させることで大規模言語モデル(LLM)の能力が低下するという「脳の腐敗(Brain Rot)」仮説です。』

ゴミのようなデータを学習させることでAIがバカになってしまう「脳の腐敗(Brain Rot)」仮説とは?
gigazine.net/news/2025102...
ゴミのようなデータを学習させることでAIがバカになってしまう「脳の腐敗(Brain Rot)」仮説とは?
SNSへ大量に投稿される、頭を使わずとも楽しめる低品質なコンテンツを俗に「Brain Rot(脳の腐敗)コンテンツ」と呼びます。ショート動画や取るに足らない画像を延々と見続けることで脳が腐る、といった意味合いがあり、SNSに溺れる人々を批判する際などに用いられるこの言葉ですが、AIも人間と同様に「脳の腐敗」という言葉を使うにふさわしい現象が発生する可能性が明らかになりました。
gigazine.net
October 23, 2025 at 3:18 AM
上の動画でも言ってるみたいだけど、AGI の世界はまだ遠くて、まだ人間が秀でてる部分もあるので、悲観せずにいることが大切何じゃないとき思う。大規模言語モデルを受けてる感想は、大規模データで損失関数を小さくしただけで、AGI ができるとは思えない。inference をもっと flops ? を増やす方向がトレンド?みたい。
October 23, 2025 at 3:59 AM
補足:

生成AI(LLM:大規模言語モデル)を作るときは、

1. 事前学習:大量のテキストデータを集め学習(最近は動画、音声などマルチモーダルデータも突っ込む)
2. fine tuning(微調整)。学習済みモデルを、より好ましい応答が出るように(例えば嘘が減るように)、人間のトレーナーや他のAIが訓練する。

こういう工程を踏みます。

コンピュータサイエンス、経済学、経営学、医学、法律といった分野では、AIはペーパーテストで高得点を出します。これらの分野は重点的にfine tuningが施されていると思われます。逆に、fine tuningが手薄な分野もあるものと考えられます。
October 21, 2025 at 4:36 AM
【NTT、大規模言語モデル「つづみ2」発表】

つづみ2は金融や医療機関、自治体で使われる業界の知見を学ばせ、2024年の初代モデルから専門業務への対応力を高めた。日本語に対する知識や解析力は、約4倍のパラメーター数を持つ米オープンAIの最新版モデルを上回ったという。
生成AI開発を巡っては、米中勢を中心に巨額投資による規模の競争が激化しており、NTTの取り組みはこうした覇権争いに一石を投じる狙いがある。
NTT、大規模言語モデル「つづみ2」発表 27年は関連事業5000億円に拡大
NTTは20日、自社開発している生成人工知能(AI)の基盤となる大規模言語モデル(LLM)の最新版「tsuzumi(つづみ)2」を公開した。日本語能力や特定の…
www.sankei.com
October 20, 2025 at 3:16 PM
(補足)
よく「日本はソフトウェアを軽視していたのでアメリカに負けた」的な言説を見聞きすることがある。その側面もあった。それだけでなく「アメリカに主導権を渡すことを日本が選択した」側面もあると思っている。

中国は、アメリカにわざと負けるつもりは全くない。それにソフトウェア開発能力では、中国はアメリカにあまり負けていない。勝っている部分も多いかもしれない。

そしてLLM(大規模言語モデル)を含めて、アメリカのビッグテックのテクノロジーに、ほんとうに革新的なものはそんなに残っていない。今のビッグテックは技術力よりも寡占が力の源泉になっている。
October 12, 2025 at 5:41 AM
宗教文書で学習訓練した大規模言語モデルがインターネットに数多く登場し,精神的洞察をただちに提供してくれるという。
どんな間違いが起こりうるだろうか?

「神へのショートカット 聖典AIのお告げにご用心」
別冊日経サイエンス279
『変わりゆく言語 ことばと認識の関係を科学する』https://www.nikkei-science.com/sci_book/bessatu/b279.html
変わりゆく言語 ことばと認識の関係を科学する|日経サイエンス
はじめに 世界で現在使われている言語の数 歴史言語学者の視点 Chapter1 言語の誕生 高度な言語が生まれた理由  C. ケネリー 赤ちゃんの超言語力  P. K. クール チョムスキーを超えて普遍文法は存在しない … 続きを読む →
www.nikkei-science.com
October 12, 2025 at 4:15 AM
https://companydata.tsujigawa.com/press-20251007-004/

株式会社coffee house(本社:東京都千代田区、代表取締役CEO:熨斗 大樹)は、2025年10月6日(月)、日本初※となる金融特化型LLM(大規模言語モデル)を活用したAIエージェントサービス「Kauka(カウカ)」を正式ローンチしました。

※公開情報をもとに金融データ基盤を基礎とした「金融特化型LLM」カテゴリでの国内提供開始状況を確認(自社調べ)

■プレスリリース配信元-株式会社coffee house […]
Original post on mastodon.social
mastodon.social
October 8, 2025 at 3:12 PM
「ProteoGPT」による抗菌ペプチドの生成

タンパク質データベースを用いた大規模言語モデルProteoGPTを構築し、抗菌ペプチドの探索/生成を可能に。多剤耐性菌にも効果がある新規の抗菌ペプチドを発見することに成功した他、低毒性も実現

タンパク質配列 x LLMは強力ですね、、
www.nature.com/articles/s41...
A generative artificial intelligence approach for the discovery of antimicrobial peptides against multidrug-resistant bacteria - Nature Microbiology
This study presents a generative artificial intelligence approach for the high-throughput discovery of antimicrobials against multidrug-resistant bacteria.
www.nature.com
October 5, 2025 at 10:00 AM
x.com/digital_jpn/...

ガバメントAIの具体化に向けたOpenAI社との連携協力📣

デジタル庁は本日10月2日、全職員向けの生成AI利用環境(プロジェクト名:源内)に、OpenAI社が提供する最先端の大規模言語モデル(LLM)を活用したサービスを新たに加え、職員が業務に直接利用できるようにする方針を決定しました。また、デジタル庁とOpenAI社は、行政の業務効率化及び公務員の働き方改革等を推進するため、行政機関向けの生成AIアプリケーションの開発と利用実証の協力の可能性を検討することとしました。
x.com
October 2, 2025 at 4:11 AM
宗教文書で学習訓練した大規模言語モデルがインターネットに数多く登場し,精神的洞察をただちに提供してくれるという。どんな間違いが起こりうるだろうか?

「神へのショートカット 聖典AIのお告げにご用心」
別冊日経サイエンス279『変わりゆく言語 ことばと認識の関係を科学する』
www.nikkei-science.com/sci_book/bes...
変わりゆく言語 ことばと認識の関係を科学する|日経サイエンス
はじめに 世界で現在使われている言語の数 歴史言語学者の視点 Chapter1 言語の誕生 高度な言語が生まれた理由  C. ケネリー 赤ちゃんの超言語力  P. K. クール チョムスキーを超えて普遍文法は存在しない … 続きを読む →
www.nikkei-science.com
September 29, 2025 at 5:42 AM