교수

인공지능데이터사이언스학과 Mugahed A. Al-antari 교수팀, VLLM 기능을 활용한 XAI기반 임상 영상 분석 시스템 'MedXpert-CAD' 개발
2025-04-03 hit 237
폰트줄이기 폰트키우기


▲'MedXpert-CAD' 실행 사진


인공지능데이터사이언스학과 Mugahed A. Al-antari 교수팀(Mukhlis Raza, Saied Salem, 권현욱 연구원)이 의료 영상 분석 시스템 'MedXpert-CAD'를 개발했다.


'MedXpert-CAD'는 대규모 언어 모델(LLM)과 비전 인코더(Vision Encoder)를 통합한 다중모달 다중 에이전트 시스템(Multimodal Multi-Agent System)으로, 챗봇 기반 증거 중심 진단 워크플로우를 통해 임상 영상 분석을 실시한다. 이후 XAI(설명 가능한 인공지능)와 VLLM(비전 대규모 언어 모델)기술을 활용해 AI의 판단 근거를 시각화하고, 사용자의 질문에 대한 정확하고 해석이 편리한 응답을 제공한다.


이 시스템은 복잡한 다중모달 임상 영상 분석의 어려움을 해결하기 위해 설계됐다. 특히 X-ray를 통해 발견한 호흡기 질환과 MRI를 통해 발견한 요추 척추관 협착증(LSS)의 2D 이미지와 3D DICOM(의료 영상 포맷) 분석에 특화돼 있으며, 사용자의 질문에 대해 몇 초 내의 빠르고 정확한 응답을 제공할 수 있다.


MedXpert-CAD는 △감독 에이전트(Supervisor Agent) △온라인 검색 에이전트(Online Search Agent) △X-ray 전문가 에이전트(X-ray Expert Agent) △LSS 전문가 에이전트(LSS Expert Agent), 총 4개의 에이전트로 구성돼 있다.


각 에이전트는 연구진이 설계한 특수 도구(toolkit)를 활용해 각각의 작업을 수행하고, 진단의 정확성과 효율성을 최적화한다.


감독 에이전트는 사용자의 질문을 직접 처리하고 적절한 하위 3개 에이전트에 작업을 배정해 원활한 분석 및 진단 결과를 제공한다.


온라인 검색 에이전트는 추가적인 의료 정보가 필요할 경우 PubMed와 같은 외부 의료 데이터베이스 검색을 실시해 더 정확한 진단에 대한 지원을 제공한다.


X-ray 전문가 에이전트는 X-ray 다중 라벨 분류를 위해 이미지-텍스트 쌍을 분석하고 질문을 이해한 후 응답을 제공한다. 이를 통해 14가지 질병을 분류하고, 전체 의료 보고서를 생성할 뿐 아니라, 시각적 중요도 지도(Saliency Map)와 경계 상자(Bounding Box)를 통해 병변 부위까지 식별할 수 있다. 또한, VQA(Visual Question Answering)기술을 적용하여 의료 영상을 해석할 수도 있다.


마지막 LSS 전문가 에이전트는 MRI 요추 척추관 협착증 관련 영상의 축(가로 단면)과 시상 면(세로 단면)을 정밀 분할해 분석을 수행한다. 분할 결과를 바탕으로 mm 단위의 척추 및 디스크 높이, 척추 높이, 추간공 거리 등의 병리학적 측정값을 제공해 정밀 진단을 지원하며, 척추전방전위증, 요추 전만 이상, 디스크 탈출증 등의 질환을 정밀하게 탐지해 포괄적인 요추 건강을 평가한다.


연구팀은 이러한 MedXpert-CAD의 다중모달 AI 기반 워크플로우 통합은 진단의 정밀도를 높이고 다양한 의료 솔루션을 제공하며, 이를 통해 의료진의 역량을 강화할 수 있을 것이라 평가했다.


한편, 이번 연구에 대한 초기 결과는 오는 9월 23일 대전 컨벤션 센터에서 개최되는 제28회 국제 의료 영상 컴퓨팅 및 컴퓨터 보조 개입 컨퍼런스(MICCAI 2025)에서 발표될 예정이다. Mugahed A. Al-Antari 교수는 "VLLM과 XAI 기술을 통합해 다중모달 의료 영상 분석 능력을 향상시킨 MedXpert-CAD는 의료진에게 신속하고 정확한 진단 지원을 제공할 것이다. 이 시스템이 의료 서비스의 효율성을 높이고, 의사, 환자 간 상담의 질을 높이는 데 중요한 역할을 하길 기대한다"고 전했다.



취재/ 최수연 홍보기자(soo6717@naver.com)