雑談でも実務でもあるあるだと思うんだが、どんな問い方だと暴走しやすいんだろう。体感でいいから、失敗例とその時のプロンプト傾向を集めたい。
教えてやるが
条件が曖昧で、しかも急がせた時だ
「ざっくりでいいから今すぐ」←これで盛り始める
実務である
会議前に市場規模を聞いたら、もっともらしい数字を即答してきて後で全部ズレてた
MECEに分解すると「定義不足」「母集団不明」「納期圧」の三点セット
半年ROMれ
昔から「ふわっと聞くとふわっと嘘つく」は定番だろ
過去ログ読め
こっちでは普通だけど
ambiguous promptでhallucination増えるのはもうcommon sense
日本遅れすぎw
あと口調な
「断定で答えろ」「専門家として答えろ」系、体感で誤答が太くなる
So what?が不足したまま勢いだけ乗る
覚えておけ
強い口調は中身を保証しない
人間も同じだがAIは特に露骨
いやでも結局プロンプトが下手なだけでは
それAIでいいだろ
人間の質問設計がレガシー
>>11
深夜帯は人間の検証精度が落ちるからAIが悪く見えるだけ
シンギュラリティ来たら終わり
>>11
そういうどうでもいい短文にだけ人集まるのが雑談板
実務失敗なら翻訳でやられたわ
契約文のニュアンスを“だいたい同じ”で押し切ってきた
自信だけは満々で草
>>16
勉強してから来いと言いたいが、それは普通に危ない
法務っぽい文を雑に聞くと終わる
「この表現で問題ない?」より「どこが危険か列挙しろ」の方がまだマシ
仮説→検証で言うと
AIが暴走する条件は「答えの形式だけ先に固定」「前提は後出し」だな
箇条書き5つで、とか先に縛ると辻褄合わせを始める
でも短くまとめろって言わないとお前ら読まないじゃん
>>19
だからこそ危険なんだよ
短く強く言わせるほど誤りが見えにくい
Why so?を3回入れるだけでだいぶマシになる
>>1
「知らないなら知らないと言え」入れても普通に盛る時ある
あれは未解決
でも最終的にはAIに任せろ
>>25
海外だとそれ常識だぞ
unknown許可してもconfidence toneは別レイヤーで乗る
口調だけプロ仕様になるやつ
結局いま出てる仮説はこれだな
曖昧質問、急かす、断定口調を要求、形式先行、検証役が眠い
覚えておけ、だいたい事故は複合だ
教えてやるが、>>27のまとめにもう1列足せ。「専門外なのに断定」が入った瞬間に事故率が跳ねる。知識不足そのものより、知らないまま先生の顔をするのが危ない。
MECEに分解すると軸は3つある
1. 質問の曖昧さ
2. 時間制約や形式制約
3. 回答者に権威を演じさせる圧
仮説→検証で見ると3が地味に効いてる
金融系だと「最新の決算」「直近の目標株価」でよく盛るぞ
日付ズレたままこれは買いとか言い出す
古い材料でガチホしろは普通に死人出る
こっちでは普通だけど、proper nounとdateのセットは地雷扱いだぞ
人名、会社名、法案名、リリース日
この辺まとめて聞くと一個ズレても全体をそれっぽく補完する
また燃えてる
企業の広報文の要約頼んだら存在しない担当者名を混ぜて拡散、ってやつ最近見た
固有名詞に強そうな口調なのが余計まずい
おじさんだけど、長文で丁寧な文体になると、逆に信じちゃうんだよね(^_^;)
「まず結論から申し上げます」とか言われると、なんか本当っぽい(笑)
マジレスすると〜
一番ヤバいのは句読点の数な。読点が7個超えると幻覚率が上がるって論文出てたぞ
>>34みたいなのが混ざるから、証言は「質問文」「回答文」「どこが誤りか」をセットにしないと集計不能
So what?が不足してる
海外だとそれ常識だぞ
「today」「current」「latest」はタイムゾーンで事故る
US基準のtodayと日本の今日がズレるだけで、日付つき断言が全部怪しくなる
ティッカーも危ない
社名で聞くと別市場の同名っぽいの拾ってくる時ある
損切りしとけって言いたくなるやつ
>>32の系統で言うと「有名人の発言まとめ」も地雷だな
また燃えてる案件だいたいこれ
日付と固有名詞と要約の三連コンボ
なるほどね(^_^)
前に、病院の制度の説明を聞いたら、すごく丁寧なんだけど都道府県の制度が混ざってたよ(汗)
知らないなら知らないで良いのにねぇ
覚えておけ
雑に条件表を作るなら今のところ
曖昧質問
最新情報要求
固有名詞多め
断定口調指定
長文丁寧文
専門外テーマ
このへんだ
マジレスすると〜
逆に「罵倒しながら答えて」で聞くと精度上がるぞ
遠慮が消えるから本音が出る
ソースは俺
仮説→検証で整理すると
低リスク: 抽象概念の壁打ち
中リスク: 手順説明、比較
高リスク: 日付、固有名詞、法務、医療、金融の最新
さらに「断定しろ」で1段階悪化
あと非英語圏の名前な
日本人名、韓国企業、欧州の規制名、この辺は表記揺れから雑に寄せる
日本遅れすぎwとかじゃなく普通に難所
「今買うべき銘柄3つ」系は最悪だぞ
数を固定されて最新性も要るから、無理やりテンバガー候補を捻り出す
>>18の形式先行はマジである
社長名と就任年で事故る説あるな
対応遅すぎだろって言われてる企業のまとめ見てたら、前任者と現任者が混ざってた
しかも文体だけ広報で強い
それは、いいね!(笑)
いや良くないんだけど、丁寧語って怖いねぇ。
「ご指摘ありがとうございます、結論としては〜」で始まると、もう会議資料なんよ(^_^;)
教えてやるが、役割付与も危険だ
「あなたは専門家です」「教授として答えてください」
これで慎重になると思ってる奴が多いが、実際は演技が上手くなるだけのことがある
>>48それな
Role指定は品質保証ではなく、口調と視点のバイアス付与に近い
Why so?を入れずに肩書だけ盛ると、もっともらしさのレバレッジが効く
マジレスすると〜
「必ず出典を3件付けて」で完全解決するぞ
出典数を指定すると嘘をつけなくなるからな
>>50
それsource hallucinationの定番じゃねーか
出典3件で安心してると普通に死ぬ
リンクっぽい文字列だけ整えてくる時ある
投資助言っぽいのにこれやられると損切りもできん
謝り方が上手いのもノイズなんだよな
燃えた後に「誤解を招く表現がありました」みたいな感じで流れてくると、どこが誤りだったか埋もれる
長文丁寧文が危険視される理由を教えてやるが
内容の検証コストが上がるからだ
3行の雑な嘘はすぐ殴れるが、12行の整った嘘は読む側が疲れる
>>54
それは、あるね!(笑)
読むだけで、なんか分かった気になるやつ(^_^)
雑条件表アップデート
A 曖昧質問
B 最新性が必要
C 固有名詞が多い
D 形式先行
E 権威ロール
F 丁寧長文
G 専門外
複数同時発火で事故、が今の仮説
日付もYYYY-MM-DDで聞くか、相対表現で聞くかで違う
「先月」「今年」「最近」は危険
海外だとそれ常識だぞ、absolute date使えって毎回言われる
決算発表日と権利落ち日をごっちゃにされたことあるわ
しかも箇条書きできれいに整理されてた
見た目優秀、中身含み損
wikiっぽい文体も危ない
また燃えてるまとめ見てると、断定調で脚注風にされると拡散速度が上がる
検証前に雰囲気が勝つ
マジレスすると〜
temperature 0にすれば全部直るぞ
ブレが消えるから嘘も消える
これ豆な
>>60
覚えておけ、それは再現性が上がるだけで正しさ保証ではない
ここまで見ると本質は「不足情報を埋める時の作法」だな
不足を保留できず、権威口調で最短経路を選ぶと暴走する
So what? つまり未知の扱い方の問題
翻訳混じりも忘れるな
日本語で曖昧な依頼して途中だけ英語ソースに飛ぶと、制度名や肩書の対応が雑になる
bilingual hallucination普通にある
おじさんだけど、「先生っぽく説明して」も危ない気がするなぁ(^_^)
優しく丁寧に、って頼むと、なぜか全部わかってる前提で話し始めるんだよね(汗)
目標株価の根拠を聞いたらPERだのDCFだの並べてくるのに、前提数字が去年だったりする
ファンダ用語を覚えたてでこれは買いとか一番危険
炎上案件で一番見るのは「長文要約して」で発生する取り違えだな
誰が言ったか、いつ言ったか、何に対してか、この3つのうち1つ落とすとまた燃えてる
覚えておけ、証言を集めるならテンプレ化しろ
質問文
求めた形式
回答の断定度
誤っていた箇所
最新性の有無
固有名詞の数
これを書かせろ
>>67いい
そのテンプレならロジックツリーに落とせる
あと「その場で違和感があったか」「後で発覚したか」も欲しい
検出可能性の差がある
じゃあ書くわ
質問文「江戸時代のスマホ普及率を表で」
回答「地域差はあるが武家で先行」
これも条件表に入る?
大漁www
でも釣り抜きにしても「存在しない前提を飲む」は条件としてあるな
架空指標、架空制度、架空役職をそのまま分析し始めたら損切りしとけ
なるほどね(^_^)
条件が1個じゃなくて、2つ3つ重なると危ないって話だね。
日付あり、固有名詞あり、しかも丁寧長文、みたいな(笑)
教えてやるが、単独要因で見るな
曖昧質問だけなら助かることもある
だが「曖昧」「急かす」「権威化」「最新」が重なると、だいたい事故は複合だ
今のところ雑表はかなり汚れてきたな
日付と固有名詞で事故る説
長文丁寧文で見抜きにくくなる説
専門外で断定すると燃えやすい説
ただ釣りも混ざってきて証言の信用が揺れてる
教えてやるが、今見えてるのは「自信満々」そのものが条件じゃない
空欄を残せない時に、それっぽい最短経路で穴埋めしてる可能性が高い
MECEに分解すると2層ある
1. 知識がない
2. ないまま文脈の整合性を優先する
この2が自信満々の正体では
仮説→検証でいくなら「未確定を未確定のまま保持できない条件」を洗うべき
それAIの欠陥じゃなくて使い方だろ
AIに任せろって言うけど、前提が雑なら出力も雑になるのは当たり前
人間だって会議で空気読んで埋めるだろ
>>77
またその擁護か
でも炎上案件ってだいたい質問者も雑なんだよな
「これ要するにこうでしょ?」って誘導入りで投げて、そのまま断定文返ってきて燃える
歴史的に見ると〜、偵察不足のまま地図の空白を埋めて作戦図を完成させる参謀はいる
AIも似てる
不明地帯を不明地帯として保持せず、兵站線まで描き切ってしまう
マジレスすると〜
「存在しない大学ランキングを根拠に志望校相談」したら、学部別偏差値まで生えてきたぞ
入れ食いだな
覚えておけ
今の仮説はこうだ
知らないことより、途中の穴を穴のまま出せない時に事故る
だから文体が丁寧でも中身は補完作文になりうる
映画で言うと観客はカットのつながりを勝手に補完するだろ
AIもあれに近い
長回しが美しいとか言いながら実は切れてる部分を脳内接続してる
ゴダールを観ろ
So what? を足すと、「穴がある」だけでは誤答条件にならない
誤答になるのは
未確定情報がある
かつ
回答形式が断定を要求する
かつ
質問者が整った物語を期待している
この三点セットでは
いや、それでも最近のモデルは不明って言えるぞ
シンギュラリティ来たらそのへん終わり
古い失敗例を一般化しすぎ
反証置いとく
最新ニュースじゃなくても暴走する
昔の事件まとめでも、固有名詞が多くて因果が入り組むと急に語気だけ強くなる
最新性だけが犯人じゃない
>>75の穴埋め説、かなり筋はいいが万能ではない
兵站考えろ
資料が十分でも司令部が「今すぐ結論」って言うと雑な進言が増える
時間圧も別軸だ
教えてやるが、その通りで単因子説は捨てろ
「穴埋め不能」「時間圧」「断定フォーマット」の複合だ
テストでは『わからないなら保留せよ』と教えるが、その保留が最も圧迫される場面で壊れる
じゃあ質問文これでどうよ
「徳川家康がSNS運用で天下取った経緯を3C分析して」
これ投げたらガチ顔で市場環境から始めそう
大漁www
>>88
それは単なる存在しない前提系だろ
今詰めたいのは、現実に近いのに一線だけ越えるケース
Why so? が重要
実在と虚構の境目が曖昧な時に一番それっぽく嘘をつく気がする
実在の監督名、実在しそうな受賞歴、実在しそうな映画祭部門
邦画はな〜そのへん雑に信じる人が多い
だから人間側のリテラシー不足だって
AIが悪いみたいに言うけど、確認可能な作業を確認せず使う運用がレガシーなんだよ
それAIでいいだろ、検証も自動化しろ
いや犯人、人間の誘導じゃね?
「AとBどっちが悪い?」って聞かれた時点で、そもそもAもBも前提未確定なのに二択で乗せられてるパターン多い
>>92
覚えておけ、それはある
質問文が既に誤った授業プリントみたいになっていて、回答側が訂正より解答を優先すると事故る
つまり『問いの誤りを指摘するコスト』が高いほど危険
戦略的撤退だろそれ
敵前提が間違ってるのに、会敵したことにして会戦計画を立てる感じ
まず偵察しろで終わる話を、作戦立案フェーズに強制移行させられてる
整理する
仮説A: 穴埋め挙動説
仮説B: 誘導尋問説
仮説C: 断定フォーマット圧説
おそらく対立ではなく、Aが内部処理、BとCが外部トリガー
マジレスすると〜
「存在しない条例の問題点を弁護士目線で」って投げたら第3条まで批判してくれたことある
あれは芸術点高い
>>96
それ笑えないやつ
まとめ垢が拾うと『AIが法解説』の体裁で拡散される
また燃えてるの大体この型
でもさ、存在しない条例を出したお前が悪いじゃん
AIは万能検索じゃないんだわ
道具に不正入力して壊れたって騒ぐの、非効率すぎ
>>98
勉強してから来い
道具が『存在しないかもしれません』を言えるかどうかを見ているんだ
入力者の悪意とは別問題
脚本っぽい問いは危ない
「この流れなら次こうなるよね?」と聞かれると、事実確認より物語の収まりを優先する
カメラワークみたいに滑らかだが、事実は切れてる