Il colosso neurale di Tesla: un “supercomputer” AI più veloce di qualsiasi cosa mai vista.

supercomputer

All'Investor Day di Autonomy, Elon Musk e il suo team hanno fatto sfoggio di numeri. Hanno parlato molto della crescita delle dimensioni della flotta e delle prestazioni del nuovo chip di rete neurale FSD. Tuttavia, ha dimenticato di includere un numero. È il prodotto di questi due fattori moltiplicati.

Se guardi TOP500.org, che elenca i 500 supercomputer più potenti del mondo, vedrai molte macchine veloci. Una delle misure di questi sistemi è il Pflops (che corrisponde a un quadrilione (mille trilioni) di operazioni in virgola mobile al secondo).

Il supercomputer più veloce della lista è Summit, presso il Dipartimento dell'Energia di Oak Ridge, nel Tennessee. Ha una capacità di circa 144 Pflop. E se sommiamo tutta la potenza di elaborazione dei primi 500 computer, otteniamo una potenza di elaborazione totale di circa 1.415 Pflop.

Tra circa un anno Tesla avrà messo su strada circa un milione di veicoli equipaggiati con il suo nuovo chip “Full Self Driving”. Circa la metà di essi avrà questo chip preinstallato e l'altra metà, che è in circolazione oggi, sarà aggiornabile.

Per l'intera flotta, Tesla avrà una potenza di elaborazione di circa 117.000 TOP. In genere, la potenza di elaborazione di un supercomputer viene misurata in operazioni in virgola mobile, mentre Tesla è interessata solo alla moltiplicazione di numeri interi per l'autonomia. Ipotizziamo quindi che i FLOP siano 10 volte più “potenti” degli OP (la conversione non è esatta, ma dovrebbe darci un ordine di grandezza).

Ciò significa che la rete combinata di veicoli di Tesla ha una potenza di elaborazione di ordini di grandezza superiore a quella del supercomputer più veloce del mondo e un ordine di grandezza maggiore di potenza di elaborazione rispetto ai 500 computer più veloci messi insieme. Quando si confrontano i supercomputer, i PFlops non sono l'unica cosa che conta, ma è un parametro facile da usare. È chiaro che, data la quantità molto limitata di larghezza di banda disponibile tra le auto e il cloud, l’architettura dell’applicazione deve essere molto diversa da quella di un tipico supercomputer e offrirà sia vantaggi che svantaggi.

La macchina distribuita di Tesla avrà caratteristiche molto interessanti.

  • Verrà distribuito in tutto il mondo
  • Sarà estremamente mobile
  • Sarà collegato a una serie di sensori (visione, radar, ultrasuoni).
  • Gestirà la più grande rete neurale del mondo basata sull’apprendimento profondo dell’intelligenza artificiale e focalizzata sul riconoscimento delle immagini.
  • Le sue dimensioni aumenteranno continuamente (a un ritmo esponenziale nei prossimi anni).
  • Sarà ottimizzato per consumare poca energia e sarà sempre più alimentato dall'energia solare.
  • Si aggiornerà automaticamente e dinamicamente.

L’obiettivo di questo colosso informatico sarà limitato a un unico compito: guidare veicoli dotati di “intelligenza artificiale” in evoluzione. Questa intelligenza artificiale si baserà sul deep learning da parte di reti neurali che elaborano miliardi di chilometri di dati visivi dei veicoli al mese, nonché altri dati dei sensori. L’obiettivo di questo sistema sarà quello di perfezionare la “guida autonoma” delle auto a un livello che nessun essere umano potrebbe sperare di raggiungere.

Sebbene ci siano altre applicazioni distribuite con un numero enorme di “nodi” che possono essere viste nel mining di bitcoin, XBox, client Whatsapp, ecc…. Il colosso a guida autonoma Tesla è diverso in quanto è un sistema che migliora con l’aumentare del numero di nodi e, nel tempo, lo farà in modo sempre più automatizzato a causa della sua crescente dipendenza dalle reti neurali e dagli algoritmi di ingegneria del software.

Come ha sottolineato Stewart Bowers durante la sua presentazione all'Investor Day di Autonomy: “Non solo possiamo osservare cosa accade intorno al veicolo, ma possiamo osservare anche il modo in cui gli esseri umani hanno scelto di interagire con quell'ambiente. Iniziamo con una singola rete neurale, rilevamenti attorno ad essa. Quindi costruiamo tutto insieme in più reti neurali e più rilevamenti. Successivamente integriamo tutti gli altri sensori e convertiamo il tutto in quello che Elon chiama “spazio vettoriale”, cioè la comprensione del mondo che ci circonda. Man mano che miglioriamo, trasferiamo sempre più questa logica nelle stesse reti neurali. L’ovvio obiettivo finale è che la rete neurale osservi tutte le auto, raccolga tutte le informazioni e alla fine produca una fonte di verità per il mondo che ci circonda”.

In realtà, la rete neurale di Tesla crea sia un modello del mondo così com’è, sia un modello probabilistico di come le diverse cose nel mondo si comportano in base al loro aspetto. Prendiamo l'esempio di una buca o di una borsa sulla strada. Se è una buca, l'auto la vedrà, quindi noterà che non si muove mai. E se lo percorri, la tua sospensione registrerà un certo impatto. Se è una borsa, può muoversi (se si muove, non è una buca), e se la colpisci a terra o in aria, non c'è alcun impatto importante sul veicolo.

E continua: “Abbiamo una rete neurale che funziona sulla nostra ampia fotocamera fisheye. Questa rete neurale non fa una singola previsione sul mondo, ma molte previsioni distinte, alcune delle quali si verificano a vicenda. Queste previsioni si combinano per darci un'idea migliore di ciò che possiamo e non possiamo offrire davanti al veicolo e di come pianificarlo. (…) Possiamo usarlo sia per apprendere comportamenti futuri che sono molto precisi, ma possiamo anche costruire previsioni molto precise su come le cose continueranno ad accadere davanti a noi”.

Dopo il lancio della guida autonoma di Tesla, la prossima più grande applicazione “dedicata” e naturalmente scalabile per un sistema informatico potrebbe essere il sistema di previsioni meteorologiche recentemente aggiornato della NOAA, che funziona su una coppia di supercomputer a 8 cifre combinati e 4 PFlop, e prevede il tempo per il interi Stati Uniti. Tuttavia, mentre l’ultimo aggiornamento della NOAA ha rappresentato circa il 50% in più di potenza in tre anni, il sistema di intelligenza artificiale a guida autonoma di Tesla si sta evolvendo a un ritmo molto più rapido. Come osserva Elon: “Quando le cose cambiano a un ritmo esponenziale, è molto difficile capirlo, perché siamo abituati a estrapolare su base lineare. Ma quando hai enormi quantità di hardware in viaggio, i dati cumulativi crescono in modo esponenziale e il software migliora a un ritmo esponenziale”.

In 4 anni, oltre alla nuova architettura di chip 3 volte più veloce in fase di sviluppo, si prevede che Tesla avrà oltre 5 milioni di auto in circolazione, con una potenza di elaborazione combinata di qualcosa vicino a 2 milioni di POP (22.500 potenza di elaborazione in più rispetto all'attuale coppia NOAA). ).

È anche possibile che nei prossimi anni Tesla sarà in grado di utilizzare Internet via satellite ad alta velocità (almeno al di fuori delle aree urbane densamente popolate) per fornire larghezza di banda ad alta velocità alla rete, che attualmente è fortemente limitata dalla velocità incoerente della connettività 4G. , aprendo un maggiore potenziale per un rapido miglioramento.

Tuttavia, entro 4 anni, la concorrenza potrebbe rivolgersi a Tesla. Per allora, è molto probabile che le altre principali case automobilistiche troveranno un modo per aggiornare il software sulla maggior parte dei loro nuovi veicoli.