来源 |Mark AI@知乎
我要说的是Tesla AI day上他们的视觉方案,其核心模板的名字也叫HydraNet,很多设计非常有启发性,想和咱们自动驾驶从业者以及爱好者一起来学习交流下。
说一句Tesla牛逼!各个模块的负责人都是行业大牛!!其中CV界华人大佬的Fei-Fei Li的学生Andrej Karpathy博士就是我今天要说的这个视觉模块的主讲人。
话不多说,要看懂这个方案我们首先明确一下:Tesla视觉系统的输入和输出↓
图一,Tesla视觉感知系统的输入和输出
Tesla的视觉系统由8个摄像头环绕车身,视野范围达 360 度,每个摄像头采集分辨率为1280 × 960,12-Bit, 36Hz的RAW格式图像,对周围环境的监测距离最远可达 250 米。
摄像头捕获环境中的视觉信息经过一系列神经网络模型的处理,最终直接输出3D场景下的 “Vector Space”用于后面的规划和智驾系统。