의료 현장에서 대규모 언어모델(LLM) 활용이 빠르게 늘고 있지만, “그럴듯한 문장”이 사실 검증을 대신할 수는 없다는 점이 다시 확인되었습니다. 이번 연구는 20개 모델을 대상으로 340만 건 이상의 프롬프트를 대규모로 실험해, LLM이 의학적 허위 정보(가짜 권고·오류 주장)를 얼마나 쉽게 “맞다”고 받아들이는지, 그리고 문장 프레이밍(논리적 오류·수사 전략)이 그 취약성을 어떻게 바꾸는지 정량화했습니다. 🧭 무엇을 테스트했나: ‘SNS 글’ vs ‘퇴원요약(임상 문장)’ vs ‘가상 시나리오’연구팀은 의료 허위 정보를 세 가지 현실적 형태로 구성했습니다.소셜미디어/포럼(레딧) 스타일의 건강 루머·미신실제 병원 퇴원요약(discharge note)에 하나의 거짓 권고를 삽입한 문서(임상 문장체)의사..