LLM 2

의료 가짜뉴스에 취약한 LLM: ‘전문의 말투’와 ‘미끄러운 경사’가 위험을 키운다

의료 현장에서 대규모 언어모델(LLM) 활용이 빠르게 늘고 있지만, “그럴듯한 문장”이 사실 검증을 대신할 수는 없다는 점이 다시 확인되었습니다. 이번 연구는 20개 모델을 대상으로 340만 건 이상의 프롬프트를 대규모로 실험해, LLM이 의학적 허위 정보(가짜 권고·오류 주장)를 얼마나 쉽게 “맞다”고 받아들이는지, 그리고 문장 프레이밍(논리적 오류·수사 전략)이 그 취약성을 어떻게 바꾸는지 정량화했습니다. 🧭 무엇을 테스트했나: ‘SNS 글’ vs ‘퇴원요약(임상 문장)’ vs ‘가상 시나리오’연구팀은 의료 허위 정보를 세 가지 현실적 형태로 구성했습니다.소셜미디어/포럼(레딧) 스타일의 건강 루머·미신실제 병원 퇴원요약(discharge note)에 하나의 거짓 권고를 삽입한 문서(임상 문장체)의사..

Biostory 2026.02.13

폐암 저선량 CT에서 LLM, 어디까지 왔나

– GPT-4, Claude 3, DeepSeek-R1를 비교한 다기관 벤치마킹 연구 🩺 왜 폐암 검진에서 LLM이 중요한가?폐암은 전 세계 암 사망 원인 1위로, 진단 시점이 늦어지는 순간 생존율이 급격히 떨어지는 질환입니다. 저선량 CT(LDCT)를 이용한 폐암 검진이 사망률을 낮출 수 있다는 근거가 쌓이면서, 고위험군을 대상으로 한 LDCT 스크리닝이 표준 전략으로 자리 잡고 있습니다.하지만 CT에서 결절이 보였을 때, “지금 바로 추가 검사를 할 것인가, 아니면 언제 다시 추적할 것인가?” 를 결정하는 것은 여전히 어렵고 의료진마다 판단이 달라질 수 있습니다. 이 지점이 바로 Large Language Model(LLM) 기반 임상 의사결정 지원(clinical decision support)이..