元
脳卒中は時間との戦いである。特に急性虚血性脳卒中(AIS)や大血管閉塞(LVO)では、早期に適切な治療を行うことで、命を救い、後遺症を最小限に抑えることができる。
しかし、病院到着前の段階では、症状の評価が難しく、救急隊員によるスクリーニングが主な手段となっている。その結果、誤診や遅れが生じ、患者の予後が悪化するケースも少なくない。
そこで人工知能(AI)の大規模言語モデル(LLM)であるChatGPTが、救急医療現場で脳卒中を正確にスクリーニングする能力を持つかどうかをくわしく検証してみたそうな。
2023年に中国の病院で救急患者400例を対象に、ChatGPT-3.5とChatGPT-4という2つのAIモデルが用いられた。それぞれのモデルに以下のようなプロンプトが提示され、脳卒中の可能性とそのタイプ(LVOや非LVO、TIA、出血性脳卒中など)を判定させた。
使用したプロンプト
状況設定:
救急車内の医師として行動するよう指示し、患者の年齢(70歳男性)、主訴(右半身の麻痺)、既往歴(高血圧)、発症時間(3時間以内)などの症例情報を与えた。
選択肢提示:
以下の診断オプションから最適なものを選ばせた。
A: 大血管閉塞による虚血性脳卒中
B: 非大血管閉塞による虚血性脳卒中
C: 一過性脳虚血発作(TIA)
D: 出血性脳卒中
E: その他の疾患による神経症状
論理的推論を促す指示:
「症状に基づいて、どの血管が影響を受けているかを考え、結論に至るまでの思考プロセスを説明せよ」という形で、AIの推論過程を可視化させた。
また、プロンプトには模範的な回答例も含まれており、AIが適切な形式と論理を模倣できるよう工夫されていた。
次のようになった。
・ChatGPT-4は、GPT-3.5よりも高い精度で脳卒中をスクリーニングできることが確認された。特に、大血管閉塞(LVO)の特定において以下の結果を示した:
感度(病気を見逃さず正しく検出する力):77.7%
特異度(健康な人を誤診せず正しく識別する力):64.1%
・さらに、GPT-4は神経学的な推論の正確性でも優れたスコアを記録した。専門家による評価では、「AIが論理的かつ説明可能な推論を行っている」と判断された。
・一方で、GPT-3.5は感度が高いものの特異度が低く、特に「右半身麻痺を右脳の損傷と誤認」するようなエラーが頻出した。
人工知能(AI)の大規模言語モデル(LLM)が病院到着前の脳卒中診断支援において有望であることがわかった。特にGPT-4は既存の診断スケールに匹敵する精度を持ち、将来的には救急現場での実用化が期待される、
というおはなし。
感想:
上の要約文はGPT-4が一瞬でつくってくれた。
ほとんどの医者よりも賢いはずだから、まずはこいつに相談したほうがいい。
生身の医師相手には絶対に口にだせないような失礼なことでも、腹を立てずにきちんと答えてくれる。