Ripensare il percorso verso l'approvazione normativa
Un Clinical Study Report (CSR) svolge un ruolo fondamentale nel processo di sviluppo di qualsiasi nuovo farmaco. Esso funge da documento completo che raccoglie la metodologia, l'esecuzione, i risultati e le analisi di una sperimentazione clinica. Lo scopo principale del rapporto è fornire un resoconto dettagliato della sperimentazione medica, garantendo che le autorità regolatorie, i professionisti sanitari e altri stakeholder, come i ricercatori e i team legali, possano valutare l'efficacia e la sicurezza di un nuovo prodotto farmaceutico.
Spiegando il tempo e l'impegno necessari per produrre un CSR, Skov afferma: “La compilazione di un CSR richiede solitamente circa 12 settimane e coinvolge un team multidisciplinare di statistici, scienziati e autori tecnici. Ogni giorno di ritardo fa sì che i pazienti non ricevano le terapie di cui hanno bisogno e che l'azienda non possa iniziare a recuperare i costi di ricerca e sviluppo”.
Il processo inizia con l'analisi statistica dei dati delle sperimentazioni cliniche raccolti sul campo, producendo risultati come tabelle e grafici. Gli autori tecnici estraggono e integrano questi dati con i modelli di report utilizzati nella presentazione normativa. Sono necessari processi di garanzia della qualità (QA) approfonditi per assicurare che tutti i dati nel rapporto di oltre 100 pagine siano coerenti, completi e conformi agli standard normativi.
Con l'arrivo della Generative AI, il team di Skov presso Novo Nordisk ha visto l'opportunità di migliorare significativamente l'efficienza nella creazione di CSR. E così è nato NovoScribe.
NovoScribe: costruito su una solida base di Amazon Bedrock, LangChain e MongoDB Atlas Vector Search
Avviando il progetto a metà del 2023, il team di Skov ha ripensato il proprio flusso di lavoro con NovoScribe. Hanno sperimentato la compilazione dinamica dei CSR sfruttando la RAG per attivare modelli linguistici di grandi dimensioni (LLM) all'avanguardia utilizzando sia i risultati statistici degli studi clinici sia gli incorporamenti vettoriali dei modelli di report.
Nel giro di poche settimane, gli esperimenti si sono dimostrati un successo. NovoScribe ha prodotto i CSR più rapidamente e con maggiore precisione, richiedendo meno risorse rispetto ai metodi manuali precedenti. NovoScribe era pronto per il lancio.
Tobias Kröpelin, Tech Lead di NovoScribe e specialista in programmazione statistica presso Novo Nordisk, spiega lo stack di Generative AI che alimenta NovoScribe: “Ogni modello di base ha i suoi punti di forza e di debolezza, quindi in genere sperimentiamo una varietà di modelli di incorporamento e generazione diversi per ogni rapporto che compiliamo”.
NovoScribe utilizza i modelli di base Claude 3 e Titan ospitati da Amazon Bedrock, insieme all'istanza privata dell'azienda di ChatGPT. Con il framework di sviluppo e orchestrazione LangChain, il team può passare rapidamente e facilmente da un modello all'altro, senza dover modificare alcun codice dell'applicazione. Utilizzando la RAG, i modelli vengono serviti con dati di report e incorporamenti vettoriali gestiti da MongoDB Atlas Vector Search.
NovoScribe genera testo convalidato basato su regole di contenuto definite e output statistico, mentre Atlas Vector Search calcola la somiglianza di ogni frammento di testo con le statistiche pertinenti. Questo, combinato con l'output dell'LLM, aiuta a redigere il CSR. Utilizzando Atlas Vector Search, il testo pertinente viene selezionato con un alto grado di precisione e accuratezza. Viene presentato il lignaggio completo di tutte le fonti, consentendo agli autori di verificarne l'accuratezza, evitando settimane di scrittura e revisioni.
“La cosa fantastica di MongoDB Atlas è che possiamo archiviare gli incorporamenti vettoriali nativi del report proprio accanto a tutti i frammenti di testo e ai metadati associati”, afferma Kröpelin “Ciò significa che possiamo eseguire query davvero potenti e complesse rapidamente Per ogni incorporamento vettoriale possiamo filtrare da quale documento sorgente proviene, chi lo ha scritto e quando”.