設計思想 / 開発者ブログ
こん!Nodです。今回はBeef Arbiter AIがどういう考え方で議論を評価しているのか、その設計思想を解説します。「なぜその判定になったのか」が分かることを、このツールの一番大事な部分だと思っているので。
「ただAIに勝敗を判定させる」だけなら簡単だ。しかしそれでは判定の根拠が不透明で、ユーザーが納得できない。Beef Arbiter AIが目指したのは「なぜその判定になったのかが分かる」透明性だった。
そのために、判定基準を設計する段階で競技ディベートの評価フレームワークを徹底的に調査した。UIL(University Interscholastic League)やNSDA(National Speech & Debate Association)といった米国の競技ディベート団体が公開している審査基準、そしてLLMを使った多次元ディベート評価を研究したDebatrix論文(ACL 2024)などを参考にした。
競技ディベートの評価基準は数十年かけて洗練されてきた「論理的議論の品質指標」だ。これをネットのレスバトルに応用することで、感情ではなく構造で議論を評価できる。
判定は以下の7軸・合計100点満点で行われる。各軸は独立しており、それぞれが議論の異なる側面を評価する。
さらに優れた論理展開には最大+10点のボーナスが加算され、100点を超えることもある(最大110点)。
採点だけでなく、議論中に使われた「卑怯な手」を検出して減点するシステムも実装している。論理学や哲学の分野で長年研究されてきた誤謬(ごびゅう)のリストを基に、ネット特有の戦術を加えた20種を対象としている。
ギッシュ・ギャロップやシーライオニングはネットのレスバトル特有の文化に深く根ざした戦術で、従来の競技ディベートの評価基準には含まれていない。これらを独自に追加したことで、SNS上の議論をより正確に評価できるようになっている。
判定の核となる「トゥールミンモデル」について少し説明しておきたい。これは哲学者スティーヴン・トゥールミンが提唱した議論の構造モデルで、すべての議論を以下の三要素で分解する。
Claim(主張):「海賊版を公然と正当化すべきではない」——何を主張しているか。
Data(根拠):「正規ユーザーが不公平感を覚えてシステムが崩壊する」——なぜそう言えるか。
Warrant(論拠):「コンテンツ産業はシステムの持続可能性に依存している」——根拠と主張をつなぐ前提。
この三点セットが揃っている議論は「立証されている」と判断される。根拠なしに主張だけを繰り返す「根拠なき断言」や、論拠が共有されていない「前提の押し付け」はここで検出される。
現代のレスバトルで新たに登場した問題がある——「AI代筆」だ。ChatGPTやGeminiで反論を生成して貼り付けるユーザーが増えている。
Beef Arbiter AIはこれを検出する機能も持っている。不自然に整理された論理構成、定型的な接続詞の連発、人間味のない中立的文体、人間が即座に書けない量の論点整理——これらの特徴を検出し、0〜100のスコアで「AI使用疑惑」を表示する。
皮肉なことに、AIがAIの使用を見破る時代になった。「人間らしさ」こそが議論の誠実さの証明になりつつある。
現在のBeef Arbiter AIはテキストの貼り付けによる判定に特化しているが、将来的にはXのスレッドURLを入力するだけで自動的に議論を取得・判定する機能の実装を検討している。
また、判定データの蓄積によって「日本語のレスバトルに最適化されたファインチューニング」も視野に入れている。ネット上の議論の質を客観的に可視化するインフラとして、Beef Arbiter AIを育てていきたい。
実際にAI判定を体験してみる
Beef Arbiter AIを使ってみる