著者は、大規模言語モデル(LLMs)を活用して、10年前のHacker Newsの議論を遡って分析するプロジェクトを開発しました。2015年12月のフロントページやコメントスレッドを自動収集し、GPT-5.1に対して後知恵を持って各記事や議論を評価させることで、過去の予測の正確さを検証し、先見の明のあったコメントや誤ったコメントを特定し、参加者を評価することを目的としています。この取り組みは、LLMsが詳細な歴史的分析を行う潜在能力を示しており、将来的には現状の行動も容易に精査できる可能性を強調しています。実行にはOpus 4.5を用い、 (1/2)
著者は、大規模言語モデル(LLMs)を活用して、10年前のHacker Newsの議論を遡って分析するプロジェクトを開発しました。2015年12月のフロントページやコメントスレッドを自動収集し、GPT-5.1に対して後知恵を持って各記事や議論を評価させることで、過去の予測の正確さを検証し、先見の明のあったコメントや誤ったコメントを特定し、参加者を評価することを目的としています。この取り組みは、LLMsが詳細な歴史的分析を行う潜在能力を示しており、将来的には現状の行動も容易に精査できる可能性を強調しています。実行にはOpus 4.5を用い、 (1/2)