语言仪

头回见有人描述这个意念场景:

最后,她给出一个例子,认为未来属于“空间智能”世界,人类可以坐在那里,带上一顶有传感器的EEG帽子,不用张嘴说话,仅靠意念远程告诉机器人:做一顿日式大餐吧。机器人收到意念后,解密意念,即可搞出全套大餐。

记得之前网上说美国军方96年就实现了,意念打字,英文字母。

关于意念,我有个名字就叫“语言仪”,大三给庞老师讲的,这样“心动就输出,想你就知道”,以西方的方式实现心灵感应,同时也能替我们写材料做汇报。

我们也可以认为“具身智能”是“语言仪”。哇塞,怎么才回味过来。

钛媒体App 7月11日消息,AI科学家李飞飞带领的团队日前发布了具身智能最新成果:大模型接入机器人,把复杂指令转化成具体行动规划,人类可以很随意地用自然语言给机器人下达指令,机器人也无需额外数据和训练。李飞飞团队将该系统命名为VoxPoser,相比传统方法需要进行额外的预训练,这个方法用大模型指导机器人如何与环境进行交互,所以直接解决了机器人训练数据稀缺的问题。(科创板日报)

这不要实现了嘛。

如何实现从“看到”到“做到”

所谓“空间智能”,是指人们或机器在三维空间中的感知、理解和交互能力。

这一概念最早由美国心理学家霍华德·加德纳(Howard Gardner)在多元智能理论中提出,让在大脑中形成一个外部空间世界的模式,并能够运用和操作。实际上,空间智能让人有能力以三度空间的方式来思考,使人知觉到外在和内在的影像,也能重现、转变或修饰影像,从而能够在空间中从容地游走,随心所欲地操弄物件的位置,以产生或解读图形的讯息。

从广义上看,空间智能不仅包括对空间方位的感知能力,还包括视觉辨别能力和形象思维能力。而对于机器而言,空间智能则是指其在三维空间中的视觉数据处理能力,能够精准做出预测,并基于这些预测采取行动。这种能力使得机器能够像人类一样在复杂的三维世界中导航、操作和决策,从而超越传统二维视觉的局限。

今年4月举行的TED演讲上,李飞飞坦言,视觉能力引发了寒武纪大爆发,神经系统的进化带来了智能。“我们想要的不仅仅是能看会说的 AI,我们想要的是能做的 AI。”

在李飞飞看来,空间智能是“解决 AI 技术难题的关键法宝”。

高度自动化

我们所说的自动驾驶系统(ADS),通常是在 3~5 层级,随着层级的提高,对系统的要求也随之提高。由于目前自动驾驶的分级,特别是 L3 和 L4 处在还没有大规模应用在实际生活之中,我们对待这个需求就存在着一些认知上的争议。

分类方法以动态驾驶任务(DDT)、DDT 的任务支援和设计运行范围来区分

DDT(Dynamic driving task):动态驾驶任务,指汽车在道路上行驶所需的所有实时操作和策略上的功能(决策类的行为),不包括行程安排、目的地和途径地的选择等战略上的功能。

车辆执行:包括通过方向盘来对车辆进行横向运动操作、通过加速和减速来控制车辆;

感知和判断(OEDR,Object and event detection and response,也称为周边监控):对车辆纵向运动方向操作、通过对物体和事件检测、认知归类和后续响应,达到对车辆周围环境的监测和执行对应操作、车辆运动的计划还有对外信息的传递。

动态驾驶任务支援(DDTFallback):自动驾驶在设计时候,需要考虑系统性的失效(导致系统不工作的故障)发生或者出现超过系统原有的运行设计范围之外的情况,当这两者发生的时候,需给出最小化风险的解决路径。

设计运行域(OperationalDesign Domain,ODD,也有称为设计适用域 或者设计运行范围)就是一组参数,指自动驾驶系统被设计的起作用的条件及适用范围,把我们知道的天气环境、道路情况(直路、弯路的半径)、车速、车流量等信息作出测定,以确保系统的能力在安全的环境之内。

综合上面的定义和分析,自动驾驶系统(ADS),通常 3~5 层级的定义可以参考下面内容。


其实只是自动化的能力级别:

自动化的能力级别分类是一个重要的概念,尤其在工业自动化、人工智能和机器人技术领域。这种分类通常用来描述系统的自主程度和复杂性。以下是一个常见的自动化能力级别分类框架,从低到高排列:

手动操作 (Manual Operation)
完全由人类操作
没有自动化元素
辅助自动化 (Assisted Automation)
人类仍然是主要操作者
系统提供一些基本的辅助功能
半自动化 (Semi-Automation)
部分任务由系统自动完成
人类需要进行监督和关键决策
条件自动化 (Conditional Automation)
系统可以在特定条件下自主运行
人类需要随时准备接管控制
高度自动化 (High Automation)
系统可以处理大多数情况
只在极少数情况下需要人类干预
完全自动化 (Full Automation)
系统可以在所有情况下自主运行
不需要人类干预
这个框架可以应用于多个领域,例如:

汽车驾驶:从手动驾驶到全自动驾驶
工业生产:从手工生产线到全自动化工厂
软件开发:从手动编码到自动代码生成
客户服务:从人工客服到全自动AI客服系统