元
大規模言語モデルベース(LLM)の人工知能(AI)チャットボットの有用性は、ヘルスケアの多くの側面で明らかになりつつあるが、患者の懸念に対応する能力は未知のままである。
そこで、脳卒中患者とその介護者から投げかけられた脳卒中リハビリテーションの一般的な質問に対する、
無料アクセスできる2つの代表的チャットボット、ChatGPT(GPT-3.5)とGoogle Bardの性能をくらべてみたそうな。
外来の脳卒中患者とその介護者からアンケートで質問を集め、テーマごとに分類し、両チャットボットに投げかける代表的な質問を作成した。
その後、正確性、安全性、関連性、読みやすさに基づいてチャットボットの回答を3人の医師(専門研修医、新米専門医、上級専門医)が評価した。
また、評価者間の一致度もフォローした。
次のようになった。
・両チャットボットとも同様の総合スコアを達成したが、関連性と安全性ではGoogle Bardの方がわずかに優れていた。
・両者とも、ある程度の一般的な正確さで読みやすい応答を提供したが、幻覚(ハルシネーション)のような応答に苦労し、具体的でないことも多く、危険な感情的状況に対する認識が欠けていた。
・さらに、評価者間の一致度は低く、医師による回答の受容のばらつきが浮き彫りになった。
AIチャットボットは脳卒中患者のリハビリサポート役としての可能性を示しているが、安全性、正確性、関連性に関して問題が残っている、
というおはなし。
感想:
GPT-3.5を使ったこの実験が行われたのが今年の2月。
つい2週間まえにGPT-4が「無料」になった。
一刻も早くすべての医師を人工知能に置き換えてほしい。
生身の医師のほとんどは医学の進歩に追いつけないし、金や名声のためなら職責を簡単に放棄してしまうから。
さもありなん
「日本の99.9%以上の医師は、新型コロナウイルスのワクチンを少なくとも黙認した。これは後世に語り継がれるべき事実である。
当時の医師は、地域の人々から厚い信頼を寄せられ、また彼らの中には家庭で立派な親である者もいた。」edited by
GPT-4
予想外の人口減少が拡大中。2019年までの自然減傾向から予測される外挿値とくらべて、現在すでに100万人以上が余計に亡くなっている。