L'esperto
Panne informatica, D'Ambros: "Inaccettabile. Prima di installarlo, un software va testato"
© Shutterstock
© Shutterstock
Redazione
un anno fa
Un guasto informatico al sistema antivirus Crowdstrike getta mezzo mondo nel caos. Voli sospesi, sistemi bancari in tilt, media e ospedali bloccati. Toccata anche la Svizzera con un centinaio di cancellazioni all’aeroporto di Kloten. “Siamo profondamente dispiaciuti”, commenta il CEO del software responsabile. A Ticinonews abbiamo cercato di capire cosa è successo con l’aiuto di un esperto.

Questa mattina il tabellone dei voli all’aeroporto di Kloten si presentava così: con la maggior parte dei collegamenti annullati. Immagini simili sono state riprese un po’ ovunque nel mondo con milioni di passeggeri bloccati a terra e impossibilitati a eseguire il check-in, dall’America all’Europa, dall’Asia all’Australia. Dappertutto schermi blu e computer in tilt. Lo stesso è accaduto a istituti bancari, sistemi di pagamento elettronici, ospedali, media (fra cui TeleTicino). Impossibile stilare una lista esaustiva dei servizi toccati dal guasto informatico annunciato a metà mattina su X da parte di Microsoft. Basti pensare che secondo i primi dati diffusi sono 1’400 i voli cancellati: oltre 500 negli Stati Uniti, un centinaio in Svizzera. Col passare delle ore il problema è stato identificato nel software per la cyber sicurezza Crowdstrike. Non un cyberattacco come in molti potrebbero aver pensato inizialmente, quindi, ha scritto il suo CEO Georges Kurtz su X, bensì un difetto riscontrato in un singolo aggiornamento che ha fatto sprofondare mezzo mondo nel caos. In Australia i clienti della Commonwealth Bank, la principale del paese, non potevano trasferire denaro. Conseguenze pesanti anche sulle borse con indici fermi a Londra e Milano. In Germania uno tra i più grandi ospedali universitari d’Europa è stato costretto ad annullare tutti gli interventi chirurgici non programmati. In Turchia alcuni cittadini hanno avuto problemi ad effettuare operazioni bancarie di vario tipo. E se col passare delle ore la situazione è stata pian piano ripristinata – a inizio pomeriggio l’aeroporto di Zurigo ha annunciato la ripresa degli atterraggi senza limitazioni e delle partenze verso gli Stati Uniti – resta da capire la portata globale dei danni. 

D’Ambros: “Si tratta di un sistema che gestisce la sicurezza a livello service”

Ma, nel dettaglio, cosa è successo? Cosa è esattamente Crowdstrike e perché è così diffuso? A Ticinonews ne abbiamo parlato con Marco d’Ambros, direttore Code Lounge (Software Institute dell’USI). D’Ambros ci ha quindi spiegato che Crowstrike è un software che gestisce la sicurezza a livello service, “quindi vuol dire che vengono installati degli agenti sui computer, questi parlano con la casa madre e attraverso un dialogo e cercano di vedere se ci sono degli attacchi o dei virus sul mio computer, quindi è una cosa che va oltre l'antivirus, perché è in continuo aggiornamento, e continua a mandare dati a Crowdstrike”. Ed è proprio qui che nasce il problema, “perché, in pratica, loro hanno fornito un nuovo aggiornamento che è stato installato da tutti gli agenti, ma questo aggiornamento conteneva un driver che era stato fatto male, e quindi installandolo, il computer non funziona più e questo crea un problema ancora maggiore, perché se normalmente posso sistemare questi problemi da remoto - facendo un altro aggiornamento – in questo caso non lo posso più fare, perché il computer non partendo impedisce all'agente di parlare con la casa madre”.

“Prima di installarlo sulla macchina del cliente andava testato”

L'unico modo per sistemarlo “era manualmente, quindi andare a cancellare un file in modalità di recovery di Windows e poi far ripartire il computer.  Immaginiamo un'azienda con 2’000 computer che si trova costretta a fare 2’000 volte questo processo a mano. Il problema, si sa, è poi rientrato, ma tutti i computer che sono nello stato che non partivano andavano sistemati a mano. Sicuramente ci sono degli errori che sono stati fatti. Prima cosa: c'è il tema del testing, tutto il software che viene mandato in produzione dovrebbe essere testato in maniera più estensiva possibile. Quindi io mi aspetterei che prima di installarlo sulla macchina del cliente venga testato. Un errore del genere doveva saltare subito all’occhio, e non si sarebbe dovuto permettere quell’aggiornamento in produzione. Un secondo tema che, avendo lavorato in aziende che si occupano di software sensibili conosco bene, riguarda il fatto che solitamente questi tipi di aggiornamenti non vengono fatti a tutti i clienti contemporaneamente, perché così se c'è un problema, che faccio? Ci sono delle transizioni, in cui  si parte con un determinato gruppo di clienti, ad esempio provenienti da una certa area geografia. Dopodiché, mi sposto sulle altre in maniera incrementale. Quindi mi stupisce che questo aggiornamento sia stato fatto da tutti nello stesso momento. Queste cose non devono succedere: un software che ha un errore così importante deve essere testato prima di essere rilasciato in produzione.

Dipendenza dalla tecnologia

D’Ambros ha poi concluso dicendo che dal canto suo il grande tema, in questo contesto, “non è tanto quanto dipendiamo dalla tecnologia, ma il fatto che la tecnologia in alcuni casi è in mano a dei grandi player privati, che quindi hanno un'enorme responsabilità e potere rispetto a tutta la popolazione. Pensiamo a Microsoft, Google, Amazon e a tutti gli altri e alla dipendenza che abbiamo da queste infrastrutture: se uno di questi servizi fosse completamente spento, anche solo per 10 minuti, l'impatto sarebbe disastroso. Quindi uno si chiede 'ma è giusto che un'azienda privata abbia questo tipo di impatto su così tanti Paesi e persone?'”.