Valutazione comparativa di modelli linguistici di grandi dimensioni per il supporto all’educazione sanitaria del paziente con BPCO: uno studio pneumologico internazionale delle risposte generate da ChatGPT-4, Claude 3.5 Sonnet e Gemini 1.5 Advanced

Marchi, Guido; Gambini, Giulia; Guglielmi, Giacomo; Pistelli, Francesco; Carrozzi, Laura

doi:10.1701/4573.45780

Three LLMs - ChatGPT-4, Claude 3.5 Sonnet and Gemini 1.5 Advanced - were evaluated on COPD questions from the GOLD recommendations. Sixty-one pulmonologists from 6 continents rated 90 AI responses for completeness, accuracy, terminology, accessibility, and safety. Gemini outperformed in completeness, Claude in accuracy and terminology, with no differences in accessibility or safety. While promising, clinical use requires caution and further validation to ensure safe, accurate patient education.

Valutazione comparativa di modelli linguistici di grandi dimensioni per il supporto all’educazione sanitaria del paziente con BPCO: uno studio pneumologico internazionale delle risposte generate da ChatGPT-4, Claude 3.5 Sonnet e Gemini 1.5 Advanced

Marchi, Guido;Gambini, Giulia;Guglielmi, Giacomo;Pistelli, Francesco;Carrozzi, Laura

2025-01-01

Abstract

Three LLMs - ChatGPT-4, Claude 3.5 Sonnet and Gemini 1.5 Advanced - were evaluated on COPD questions from the GOLD recommendations. Sixty-one pulmonologists from 6 continents rated 90 AI responses for completeness, accuracy, terminology, accessibility, and safety. Gemini outperformed in completeness, Claude in accuracy and terminology, with no differences in accessibility or safety. While promising, clinical use requires caution and further validation to ensure safe, accurate patient education.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno
	
				2025
			
	Codice DOI
	
				https://dx.doi.org/10.1701/4573.45780
			
	Tutti gli autori
	
						Marchi, Guido; Gambini, Giulia; Guglielmi, Giacomo; Pistelli, Francesco; Carrozzi, Laura

File in questo prodotto:

Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11568/1326528

Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni

ND

ND

ND

CINECA IRIS Institutional Research Information System

Valutazione comparativa di modelli linguistici di grandi dimensioni per il supporto all’educazione sanitaria del paziente con BPCO: uno studio pneumologico internazionale delle risposte generate da ChatGPT-4, Claude 3.5 Sonnet e Gemini 1.5 Advanced

Marchi, Guido;Gambini, Giulia;Guglielmi, Giacomo;Pistelli, Francesco;Carrozzi, Laura

2025-01-01

Abstract

Scheda breve

Scheda completa

Scheda completa (DC)

Attenzione

Citazioni

social impact

CINECA IRIS Institutional Research Information System

Valutazione comparativa di modelli linguistici di grandi dimensioni per il supporto all’educazione sanitaria del paziente con BPCO: uno studio pneumologico internazionale delle risposte generate da ChatGPT-4, Claude 3.5 Sonnet e Gemini 1.5 Advanced

Marchi, Guido;Gambini, Giulia;Guglielmi, Giacomo;Pistelli, Francesco;Carrozzi, Laura

2025-01-01

Abstract

Scheda breve Scheda completa Scheda completa (DC)

Informazioni

Attenzione

Citazioni

social impact

Conferma cancellazione

Scheda breve

Scheda completa

Scheda completa (DC)