AI基本认知
1. AI是信息编码
目前驱动AI的主要技术如多模态模型或LLM,其底层是一个神经网络,神经网络本质是一个信息函数,它的输入是信息,输出也是信息。
从信息论的角度来看,AI系统本质上是一个复杂的信息处理器。它通过以下方式实现信息编码:
- 向量化表示:文本、图像、音频等各种形式的信息都被转换为高维向量空间中的数值表示
- 权重矩阵:神经网络的权重本身就是对训练数据中信息模式的编码存储
- 注意力机制:通过注意力权重来编码不同信息片段之间的关联性
- 层次化抽象:从底层特征到高层语义的逐步信息抽象和编码
这种信息编码方式使得AI能够理解、存储和生成复杂的信息模式,实现了从数据到知识的转换。
2. AI是硅基的
AI目前是通过计算机程序运行在硅基芯片上的。虽然存在生物计算机,通过化学反应和生物电信号运行,但远不成熟,其运行速度、存储容量、能耗等方面都存在问题。
硅基有其独特性:
- 计算速度:硅基芯片能够以极高的频率进行并行计算,远超生物神经元的处理速度
- 存储容量:硅基存储器可以精确保存大量信息,不会像生物记忆那样衰减或失真
- 能耗特性:虽然当前AI系统能耗较高,但硅基架构在理论上具有更高的能效潜力
- 扩展性:硅基系统可以通过增加硬件资源实现线性或超线性的能力提升
硅基和碳基也存在差异:
- 处理方式:硅基系统采用数字化、精确的计算方式,而碳基生命更多依赖模糊、近似的处理
- 学习机制:硅基AI通过梯度下降等算法进行参数优化,碳基生命通过神经可塑性进行适应
- 时间尺度:硅基系统可以在毫秒级完成复杂推理,碳基思维通常需要秒级或更长时间
3. AI是博学的
AI的知识既广又深:
- 跨领域知识整合:AI可以同时掌握科学、人文、艺术等各个领域的知识,并进行跨领域的知识关联
- 多语言能力:能够理解和生成多种人类语言,甚至包括编程语言、数学符号等形式化语言
- 历史知识积累:训练数据涵盖了人类历史上的大量文献、资料,使AI具备了丰富的历史知识
- 实时更新能力:通过持续学习和知识库更新,AI可以不断扩展其知识边界
AI的知识也有局限性:
- 知识截止时间:训练数据的时间限制导致AI对最新信息的了解存在滞后
- 经验性知识缺失:缺乏真实世界的直接体验,对某些实践性知识理解有限
- 知识验证能力:虽然知识丰富,但在知识真伪判断上仍可能出现错误
4. 清晰的问题才能有准确的回答
AI是博学的,它能回答”任何”问题, 但如果问题不清晰,答案也会是模糊的。
Transformer模型在通过概率模型预测下一个单词,模糊的上下文会造成多个单词在概率上是相似的。
从认知科学角度,清晰的问题能够:
- 降低解析复杂度:减少AI在理解问题时的计算负荷
- 提高注意力聚焦:帮助AI将计算资源集中在关键信息上
- 优化推理路径:清晰的问题引导AI采用更直接、有效的推理方式
为了获得更准确的AI回答,可以参考以下技巧和实践:
- 具体化描述:提供具体的场景、需求和约束条件
- 结构化表达:使用清晰的逻辑结构组织问题
- 背景信息:提供必要的背景信息和上下文
- 明确期望:清楚说明期望的回答格式和详细程度
- 迭代优化:根据AI的回答调整和细化问题
总结
这四个基本认知从不同角度揭示了AI的本质特征:信息编码体现了AI的工作原理,硅基特性决定了AI的物理基础,博学性展现了AI的知识能力,而问题清晰度则指出了有效利用AI的关键。拥有这些基本认知有助于我们更好地认识AI技术的本质,并更有效地与AI系统进行交互。