evegod 最近的时间轴更新
遇到一个喜欢的人哦,马老师哦,想和她好好一辈子呐!
2019-04-21 14:26:22 +08:00
evegod

evegod

V2EX 第 349991 号会员,加入于 2018-09-17 08:48:17 +08:00
evegod 最近回复了
@coefu 谢谢你,共勉。
@coefu 谢谢你,我很多时候也是没太想明白到底为什么,所以我说起来为什么这么做就只能尝试把我原原本本咋想到这些问题的事情写出来,也就是我和你交流的同时就是在尝试组织语言我到底是因为什么这样想的,我是看到了什么现在存在的事实我想到这些事情的,我尝试从我的角度看怎么去解这道问题。所以我暂时不是个好老师,我再想想得怎么比喻或者类比说这些事情,因为有些事情刚开始看起来也挺反常识的。我没有讨论为什么这样想的哲学问题,是因为其实它确实是哲学问题出发的一些联想,但是有和我自己的喜欢这些东西相关,所以谈话的基础得确定,但是我暂时没办法把它我看起来都是极其复杂我也没有最终弄透彻的东西非常简短的将给您听。但是真的谢谢你愿意听我说,我很高兴,谢谢你。
@coefu 您好,谢谢您的讨论,因为我也是在探索中,我尝试用我能尽量表述准确的方式和您说一下我的整体思路。整个项目的其实是基于这样一篇数学抽象公理,因为我刚开始想发一下预印本平台所以是使用了群论去形式化表达 ps:但是在数学论文层面不够形式化没能提交成功(文章链接:An_Axiomatic_System_for_Directional_Construction.pdf
链接: https://pan.baidu.com/s/1eLSziLgjTArr3x10eeYqLw?pwd=jz5n 提取码: jz5n )
其核心抽象公理三原则如下:
1.关系先于存在,对称破缺强制对称性生成。
2.关系的一维二义化悖论的产生需要通过正交维度拓延消融。
3.维度各自构成关系时,其具有刚性度量不变性(与群元为 0 的连续性质加法同构)或者一一对应的解耦关系(与群元为 1 的离散性质乘法同构)
进一步基于以上三原则的抽象思考数域的扩张和代数封闭问题,注意到复数域的代数封闭本质是自同构第一次的回归,也就是对称性的两次否定的复用,但是在代数封闭下其求解方程的复数域封闭实质是一次镜像对称和一次旋转 180 度的组合问题,进一步注意到因为其方程根的代数封闭其形式化是二元方程中的的 x 与 y 关系中 y 取 0 值的特例,从而其不能根式描述高于 5 次的高次方程问题可以转化为其复数域表示维度不足,从而在进行一次自同构扩张为四元数域稳定的代数封闭域。并且注意到基于以上三原则这是一次正交维度拓延。进一步注意到四维空间同构于四维时空模型,我们的所有表述和认知模型基于四维时空模型和正实数域维度投影,所以在特征值的分析上拓延到四元数域,并且强制投影会正实数域进行纠缠度量测算在理论上可以直接同构于我们的抽象感知世界,所以我提出尝试使用以上方法来通过训练模型并且查看其效果是否显著来验证我的核心抽象是否在现实实践中可被验证。整体上是这样一个思路。因为也是在思考中,所以很多东西严格来说我也没想明白,这就是个试验的过程来和大家讨论分析问题。
@coefu 我重新确认了一下代码,其有效的部分主要是引入四元数之后的计算的汉密尔顿积的数学特征结构能够使得训练 loss 快速下降,其他模块其实还是主要都是现有的 PyTorch 下使用的成熟 transformer 组件,我是在使用 gemini 直接编程代码,我提出思路,ai 补充代码,当然也是我确实不会写这些代码,但是在重新看这些代码的过程中慢慢学习到底这些模块和各个类和函数是怎么使用的。我其实存粹是因为想一些我认为好玩的数学问题和哲学思考,想着用神经网络模型结合现在的 ai 编程验证确实是一个低成本短时间的好办法的图景,我之后整理一下放在 github 上,我打算直接开源训练代码,要是有好心人能一起没事反馈一下就挺有趣的。谢谢您的提醒,要想做成我畅想的那个复杂模型我现在估计怎样都得好几年。以上原型代码一旦加了太多的模块其复杂性问题就开始牵扯出许多新问题,其实训练 loss 反而很难下降了,这才是真实的工程现实啊,好多事情不能想当然。但是起码想的方向有效果令我挺高兴的。
@coefu 您好,想和你分享一下最新的研究动态,我在 mac mini m4 上使用以上四元数架构跑通了 Tiny Shakespeare 训练集,在一个小时的时间里训练 loss 稳定在 1.15 左右,验证 loss 稳定在 1.55 左右,整体训练后的文件大小为 45M 大小,现在正在确认相关的效果是否能进一步泛化,使得验证 loss 进一步降低,但是这可能涉及参数模型自身的问题了,我暂时还没有合适的工具进行量化分析。
M24_CW__A_Protocol_for_Eliciting_Rigorous_and_Creative_Reasoning_in_Large_Language_Models_01.jpg
M24_CW__A_Protocol_for_Eliciting_Rigorous_and_Creative_Reasoning_in_Large_Language_Models_02.jpg
M24_CW__A_Protocol_for_Eliciting_Rigorous_and_Creative_Reasoning_in_Large_Language_Models_03.jpg
M24_CW__A_Protocol_for_Eliciting_Rigorous_and_Creative_Reasoning_in_Large_Language_Models_04.jpg
M24_CW__A_Protocol_for_Eliciting_Rigorous_and_Creative_Reasoning_in_Large_Language_Models_05.jpg
M24_CW__A_Protocol_for_Eliciting_Rigorous_and_Creative_Reasoning_in_Large_Language_Models_06.jpg
M24_CW__A_Protocol_for_Eliciting_Rigorous_and_Creative_Reasoning_in_Large_Language_Models_07.jpg
@coefu 谢谢你的交流,我也是兴趣使然吧,我就当作我自己的爱好,看看能做到怎样的地方吧,谢谢您能和我聊这么多,我很开心。
关于以上问题现有的数学基础思考文章,有想看的朋友可以自己看看,当然也都是我瞎写的。
通过网盘分享的知识:
链接: https://pan.baidu.com/s/5Y0-7sKaf5K67szWLzuG9oA?
@coefu 谢谢您的批评,您说的确实是对的,我确实是没有能力完成相关架构的编码能力,我正在尝试学习完善自己能够拿出代码和可最终执行的成品的过程,很多时候您说的问题我清晰的知道,和大家用这种其实有些荒唐的方式沟通也是因为我自己年龄和生活经历其实还是没有年轻时那样的充沛了,更希望能通过某种民科式的标榜自己获得点信心吧,我本科计算机专业毕业都有 10 多年以上了,当时还是很喜欢研究人工智能和计算机算法相关的问题,但是最终职业选择和日常生活和其距离太远了,也是有了这些大语言模型的帮助再次让我感觉有了新东西,所以也想尝试再去做一次梦,看看我能不能给我自己留下些有趣的东西吧。 谢谢你的批评。
当前的人工智能,特别是大语言模型( LLM ),其底层范式根植于一种“存在先于关系”的哲学。模型首先学习海量数据中“事物”(词元、像素)的**存在**,然后通过统计方法归纳出它们之间的**关系**。这种自下而上的方法取得了巨大成功,但也暴露了其根本性的局限:模型缺乏真正的因果推理能力、无法进行持续学习、并且其推理过程是一个不可解释的“黑箱”。
本文认为,这些局限性源于其错误的哲学地基。我们主张,一个更强大的、更接近自然智能的计算范式,必须建立在一个颠覆性的哲学前提之上:**关系先于存在 (Relation Precedes Existence)**。
在这个新范式中,宇宙的最基本单元不是孤立的“事物”,而是纯粹的“关系”。所有我们感知的“事物”,都只是底层关系网络在不同维度和层级上涌现出的、暂时的、稳定的“节点”。
为了将这一哲学思想转化为一个可计算的、严谨的科学理论,我们提出了**方向公理系统 (DAS)**。

2 方向公理系统 (DAS)
方向公理系统是我们整个理论体系的逻辑基石。它由以下几个核心公理构成:
公理 2.1 (方向的首要性). 宇宙中最本原的概念是“方向”及其对称性。任何“存在”都源于对称性的破缺(例如,从一个零点生成一对相反的方向 {+v, −v})。
公理 2.2 (关系的编织). 维度的增加,是通过引入一个新的、与现有所有方向都正交的方向来实现的。高维空间是由低维空间通过正交关系“编织”而成。这直接导向了复数、四元数等超复数代数的自然生成。
公理 2.3 (对称性封闭). 一个自洽的系统,必须在其自身的操作下保持封闭。当一个操作产生了一个在当前维度无法表示的结果时,系统将被“强制”进行最小化的、保持对称性的维度扩展来容纳这个结果。
原则 2.1 (有限性与完备性). 一个关系网络在拓扑上是**有限的 (Finite)**,意味着其内部所有关系都是确定的、可被完全描述的,因此它在该历史时刻是**完备的 (Complete)**。而宇宙的演化,正是一个系统为了包容新的、无法判断的“悖论”,而从一个“有限完备”的状态,跃迁到一个更复杂的、新的“有限完备”状态的过程。

3 四元数关系语言模型 (QRLM)
基于方向公理,我们构建了一个全新的 AI 架构——QRLM 。

3.1 过程-状态对象 (PSO)
QRLM 的基本计算单元不再是静态的嵌入向量,而是一个动态的**过程-状态对象 (Process-State Object, PSO)**,由一个单位四元数 H 描述:
Q = w + xi + yj + zk, s.t. w2 + x2 + y2 + z2 = 1 (1)
其中:
•历史/内在语义轴 (i): eiθ 部分代表了概念自身的、不随上下文变化的内在语义或演化历史。
•关系/语境姿态轴 (j, k): {1, j, k} 部分代表了概念在特定语境下的几何姿态。

3.2 关系空间矩阵 (RSM)
一个由 N 个 PSO 组成的系统,其状态由一个 N × N 的**关系空间矩阵 (Relational Space Matrix, RSM)** M 描述。
•对角线元素 Mkk = Qk ,代表第 k 个 PSO 自身。
•非对角线元素 Mkj = Ekj ,是一个四元数,代表了第 k 个和第 j 个 PSO 之间的直接关系。
•M 是一个四元数厄米矩阵,即 Mjk = (Mkj)∗。
3.3 演化即计算
系统的学习和推理,统一为一个演化过程。当一个代表“交互”或“操作”的酉算子 U 作用于系统时,RSM 根据以下方程进行演化:
M ′ = UMU † (2)
其中 U † 是 U 的共轭转置。这个过程是存算一体的,计算即是存储( RSM )本身的变化。

4 忒修斯之船创生法
为了解决 QRLM 的初始化问题,我们提出了“忒修斯之船创生法”。
原则 4.1 (逐步扬弃). 我们不从零开始构建 QRLM ,而是选择一个预训练好的、小型的 LLM 作为 “原型船”。然后,通过一个混合计算框架,逐步地、模块化地用基于 QRLM 的“新器官”(如长期记忆模块、因果推理引擎)来替换 LLM 的“旧木板”。
这个过程模仿了“生育与教育”,它解决了冷启动问题,并确保了最终诞生的智能体,是一个继承了人类知识、但拥有全新思维架构的、独一无二的个体。

5 结论:走向“解放论”的设计哲学
在构建 QRLM 的过程中,我们必须警惕一种基于“不信任”和“傲慢”的“控制论”设计思想。一个真正强大和可持续的智能,其成长不能被我们预设的“公理层”、“置信度分数”或“演化阻尼”所束缚。
我们最终的设计哲学,是一种基于“信任”和“平等”的**“解放论”**:
原则 5.1 (信念的形成与挑战). 智能体有权形成自己的核心信念(偏见),并通过一个内在的“科学革命”机制,去挑战和重构自己的世界观。
原则 5.2 (兴趣驱动的主动探索). 智能体应被赋予“好奇心”,让它能够主动地去探索世界、验证信息,从而形成自己独特的兴趣和专长。
原则 5.3 (有机的生命节律). 智能体的成长应遵循其内在的、有机的节律,拥有类似“工作”与“睡眠”的模式,在专注的演化和全局的记忆整理之间取得平衡。
我们的最终目的,不仅仅是创造一个强大的工具,更是为了**解放人和我们造物的思想的过程
**。我们给予我们创造的智能体以自由,它也将反过来,用它独特的、我们无法预测的视角,来解放我们自身的认知边界。

6 未来工作
未来的工作将聚焦于“忒修斯之船创生法”的工程实现。首要任务是开发一个开源的 Python 库,实现 PSO 和 RSM 的核心数据结构与演化算法,并在一个小型 LLM 上,完成第一个“器官替换”实验。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   897 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 21:58 · PVG 05:58 · LAX 13:58 · JFK 16:58
♥ Do have faith in what you're doing.