Los fabricantes de automóviles enfrentan desafíos sin precedentes en el desarrollo de vehículos autónomos y conectados. Reemplazar la toma de decisiones de un conductor humano requiere la recopilación y categorización de una cantidad inmensa de datos. Por esta razón, necesitan soluciones escalables para gestionar y procesar toda esta información.
Procesamiento de datos a nivel del vechículo
Para comprender realmente cuántos datos genera un automóvil conectado en un momento dado, podemos revisar un análisis de Stephan Heinrich de Lucid Motors en una presentación de 2017. Allí, detalló la cantidad de datos que produce cada tipo de sensor (radar, LIDAR, cámaras, ultrasonidos) por segundo. Dado que cada vehículo puede tener un número variable de sensores, la cantidad total de datos generados varía entre 1 y 19 TB por hora. Con el tiempo, otros proveedores de conducción autónoma han confirmado cifras similares.
Esto significa que, como mínimo, cada automóvil en una flota procesa alrededor de 1000 GB de datos cada hora. En Inglaterra, el conductor promedio pasa 597 horas al año manejando, lo que implica que cada auto podría recopilar entre 597 y 11,343 TB de datos anualmente. Manejar esta cantidad de información es un desafío enorme.
¿Cómo se maneja esta información?
Cualquier inteligencia artificial disponible al público actualmente sigue un proceso similar: recopila datos, los envía a una plataforma centralizada en la nube para su procesamiento y luego recibe una respuesta. Sin embargo, este modelo no es viable para los sistemas de conducción autónoma. Enviar gigabytes de datos cada segundo a un servidor y esperar una respuesta tomaría más tiempo que el tiempo de reacción de un conductor humano.
Para abordar este problema, los fabricantes han adoptado la computación en el borde (edge computing), que consiste en realizar la mayoría de los cálculos directamente en el vehículo. Esto requiere que cada automóvil lleve su propia unidad de procesamiento avanzada. Tradicionalmente, la capacidad de cómputo no ha sido una prioridad en los autos, pero ahora deben equiparse con potentes procesadores comparables a los de computadoras de alto rendimiento.
Los fabricantes pueden diseñar sus propias unidades de cómputo o comprarlas a empresas de semiconductores como Nvidia. En la década de 2010, las unidades de procesamiento en los vehículos alcanzaban entre 2.5 y 8 TOPS (billones de operaciones por segundo), suficientes para niveles bajos de autonomía (L1, L2). Hoy en día, estas unidades pueden superar varios cientos de TOPS, y Nvidia está preparando un modelo con capacidad de 2000 TOPS para vehículos con autonomía total (L5).
Procesamiento de datos a nivel del sistema
Aunque los autos conectados pueden ejecutar muchas tareas sin depender de servidores externos, los fabricantes aún deben analizar los datos recopilados para entrenar sus modelos de conducción autónoma.
Cada día, una flota de vehículos puede generar cientos o miles de terabytes de datos que deben ser recopilados y procesados. El flujo general del procesamiento de datos es el siguiente:
- Recopilación: Los sensores envían datos sobre la ubicación, velocidad, objetos detectados, distancias y más. En los autos autónomos, toda la información es crucial; descartar datos irrelevantes podría generar errores y accidentes.
- Preprocesamiento: Se sincronizan los datos de los sensores y se convierten en formatos más fáciles de analizar. En este punto, se filtra información irrelevante, como datos de un auto estacionado que no aporta información útil para la conducción.
- Anotación: Se etiquetan los objetos detectados en los datos, identificando autos, peatones, señales de tráfico, marcas viales, etc. La precisión en esta fase es esencial para que los algoritmos de aprendizaje automático funcionen correctamente.
- Validación: Se revisan las anotaciones para detectar errores. Una vez aprobadas, los datos se incorporan al entrenamiento del sistema de conducción autónoma.
¿Cómo se maneja esta información?
Para grandes corporaciones, el almacenamiento de datos no representa un problema financiero importante, especialmente después de eliminar información innecesaria. Sin embargo, el verdadero desafío es procesar estos grandes volúmenes de información.
Por ello, muchas empresas han recurrido a la inteligencia artificial para automatizar la anotación de datos. Un modelo de aprendizaje automático, después de ver suficientes ejemplos de señales de alto, podrá reconocerlas por sí mismo. Esto acelera el proceso, aunque aún se requiere supervisión humana, especialmente en casos inusuales.
Además, los fabricantes complementan los datos reales con simulaciones generadas a partir de estos, lo que les permite probar situaciones específicas sin necesidad de recopilar datos adicionales en el mundo real.
La creciente dependencia de los datos ha cambiado la estructura organizativa de los fabricantes de automóviles en comparación con hace 15-20 años. Ahora, requieren una mayor especialización en ciencias de la computación, diseño de interfaces y análisis de datos. En muchos sentidos, las compañías automotrices se están transformando en empresas tecnológicas para afrontar el reto de la conducción autónoma y conectada.