Graphorall

Back

ideas

Linked References (75)

人确实是个RL,而且不知怎么train自己 #ideas

  • 经常性的直觉目标和理性目标不一致

    • 可能受风险收益推测影响,直觉的reward model和理性的model不一致,直觉更冲动

类似可信计算,推出可信设置 #ideas #OS

  • 用于开卷考试,向考试方证明符合条件,如未联网、未使用大模型,或仅使用文档浏览软件

有没有办法把序列模型的prefix固化为网络参数? #AI #ideas

  • 即将特定任务的特定prompt固化为LoRA

    • 便于调试,无需大规模数据

    • 性能较好,且不影响context

技术圈的历史由胜利者书写 #ideas #算法的力量

  • 若干年前神经网络没有取得成功,于是当这一波热度来袭再没有人回望过去的遗存

  • 假如若干年后图的热度高起来,会有人想起前人不那么成功的尝试吗?比如SPARQL?

  • 主动或被动的忽略

    • 不可避免的话语体系gap、基础环境变迁使得很多问题失去意义、主动灌水

    • 以至于重新发明比“技术考古”更合意

    • 顺便刷一波credit

生成式UI的一种可能场景 #ideas #OS #AI

  • 数据分析的时候,比如分析gh issues,逻辑部分用代码,而展示部分希望能自动化

  • 毕竟很多数据本身就有standard展示UI

眼动的一个应用场景 #ideas #OS

  • 很多次要关注点悬浮在桌面上,如视频小窗

    • 既不能遮挡主要内容,但也希望有一些持续/随时关注,所以缩得比较小

  • 当视线gaze上去,自动放大

    • 放大操作需要更点击、拖拽

  • 其实很多case就是需要在个位数的动作间做优化,体验截然不同

现有内核fuzz可能的盲区 #ideas

  • 启动命令/构建配置 etc.非运行时动态配置的

    • 因为以syscall为界面

  • 类比到SoC,则是,先通过基础固件配置得到一个minimal runtime,再操作

操作系统还能提供什么服务 #OS #ideas

  • 狭义上,由于运行环境的统一、开发环境的分裂,都下沉到语言、框架、包了

    • 真的吗?

    • 性能瓶颈

      • 端侧AI的per app代价太高

      • 先进人机交互技术与设备紧耦合

    • 功能瓶颈

      • 跨app意图连续性

  • 多样化的交互->“操作”系统转换->基础统一的action

  • 延伸:向着SQL进发?

    • 例如,权限管控是否需要per app搓一套?

      • 看rustdesk的blog里还在enhance ACL

  • 远程访问

  • 终端大数据

    • 终端操作系统在大数据浪潮中是否缺席?

    • 服务智能化

    • 安全审计

      • 行为序列的人工智能审计

    • Linux的战略优势

      • 开源开放——隐私焦虑

      • 生态壁垒——AI原生、大数据原生

LLM+语言学习? #ideas #AI

  • 在良好的TTS支持下,AI可能已经可以胜任教学级别的1v1对话

  • 公域知识不缺乏教学顺序、章节

  • 以前主要集中在记忆曲线优化背单词,现在玩法更多了

    • 内容多样性

      • 单词、语法、非规则语法及其背后的故事

      • 具体情境

      • 跨语言的源流

    • 权衡:讲故事容易记住,但也不能天天讲故事

    • 量身打造:根据你的情况现编

      • 当然有一定隐私问题

Thermal airship - Wikipedia #ideas

  • 如果使用柔性绝热材料,能做到什么极限?

    • [@tiwariLighterThanAirRevolutionAdvancements2024]

    • Microsoft Copilot: 你的 AI 助手

      • image.png{:height 419, :width 290} 真的假的?这么低?

    • TODO “烂大街”的民用材料,有空试试

应用程序间依赖 #ideas #deepin

  • logseq或浏览器插件依赖zotero,如何自动拉起?

    • 进一步的,如何细粒度划分并感知活跃状态,并根据依赖关系suspend其他程序

      • ~~更进一步的,代码partition进而优化页缓存?~~好像没必要了

集成jupyter类似物 #ideas #logseq

包管理 #ideas

  • 需求

    • composable

      • nix的缺陷,源自compatibility

      • 共享资源

        • configuration

          • configuration (more) / other postprocessing (less) / user-modified?

          • 简单的解决方案:对每种组合执行postinst

            • =>每种组合是否会出现问题?组合测试

          • 复杂的解决方案:理解后统一configuration操作

          • 判断user-modified

        • dep

        • IPC

          • how?

          • 冲突检测

    • functional

      • -> reproducibility

    • multiversion

      • virtual environment for each exe

        • via container

        • challenge: exe identify

          • for binary

          • for interpreter

看降水线北移的回答里“我死后哪管洪水滔天”突然想到了(((66c4b35a-eefc-4371-ad4e-29ffaae3173a)) #ideas

  • 气候战争未必在人与人间发生,也可能在人与AGI间

    • 生存是第一需要

    • 硅基更适合于走向星辰大海,然而也受到科技各领域制约

      • 而不是某些想象中一点点基本要素+几条破船就上太空“殖民”去了

    • 按人类应对气候问题的速度,可见的将来环境恶化到一定程度,研发锁死乃至于减退

行李箱 #ideas

  • 现有

    • 铝壳结实但贵而重

    • ABS脆,PC略软,固定箱轮处容易整体断裂

    • 壳体承力效力不佳

      • 楞抗弯性能较低?

      • 面的抗拉性延展性挺好

  • 改进

    • 框架承力

      • 轻质金属桁架

      • 轮、拉杆固定在框架上

    • 蒙皮保证完整性

      • 偏软的材质也OK

    • 闭合

      • 防水拉链

        • 金属、双层?

    • 拉杆、箱轮

      • 自行更换

任务管理方面的优化 #ideas #logseq

  • 任务拆解时,子任务的自动化

    • 自动创建,当然要和content做区分

    • 自动依赖,树状相对简单

      • 图状就麻烦咯

      • 复用其他树图转化写法

  • 自动状态管理

    • 子任务doing则其路径上都doing?

      • 更好的粒度则是,祖任务的doing = any(child.doing,即若doing的转为done且其他子任务todo,则祖任务转为todo

      • 语义条件并不简单对称

课程该有changelog #ideas

看下ICSE等软工顶会有没有研究依赖管理的 #ideas #OS

  • Dependency Solving Is Still Hard, but We Are Getting Better at It

    • 这篇算是最近最完善的了

      • versioning这块儿就想吐槽

        • 明明是各非完全耦合的feature,非得弄成串行的序号

    • new trends

      • containerization

        • incompatible的共存

        • 环境lock

      • functional

        • reproducibility

      • 那如果我都要呢?

        • 完善语义(增强限制or合理区隔)

        • 问题求解

          • 方案搜索空间增加了,冲突的可以共存?

    • 欧洲整的还是优雅啊

      partially funded by the FASTEN project, part of the European Commission H2020 program

符号vs端到端神经网络 #ideas

  • massive branches, sparse activation #gpu

  • 例:智能安防,偷窃自行车,一个人取走了不属于他的车

    • 巨量任务组合,不可能为每种任务都建立端到端网络&推理

    • 跨端,不可能将所有数据集成至中心

  • 人的上限与超越人类,突破架构局限性

[12-29]AIA:AI辅助算法设计的若干尝试----中国科学院软件研究所 #ideas

  • 要的就是这种

  • 啊,竟然是卜东波老师

    • 刚才看UCAS课程推荐还看到他的算法课了

边缘计算的场景? #ideas

  • 离不开地理维度,geo-partitioned/geo-clustered

    • 在线协作,通常协作方在空间上某种聚集

    • 地域导致的信息偏好

  • p2p转发

  • 个人数字助理

networm #ideas

之前想弄的suspend Reddit - Dive into anything #ideas

刷知乎看 张宏波 在全国计算机系主任会议上推广他们做的Moonbit,总觉着各种PL还可以进一步统一一下 #ideas

  • 一方面是各家的中端都是做各种constraint check、inference

  • 另一方面现代高级语言的feature总共也就那么些,可以枚举出来,为何不能自定义自由组合?

看了下 ideas,忘了怎么想起,感觉数据中心的浮点算力过剩/浪费了

  • Is CPU’s floating point capability surplus in normal data centers? usually the workloads like database only involves in interger computing #new bing

    • #+BEGIN_QUOTE
      In **normal data centers**, the importance of **floating point capability** in CPUs depends on the specific workloads being executed. Let's delve into this topic:
      
      1. **Floating Point Capability**:
          - CPUs are designed to handle both **integer** and **floating point** operations. Floating point arithmetic is essential for scientific simulations, graphics rendering, and other computationally intensive tasks.
          - The **IEEE 754 standard** defines how floating point calculations should be approximated. It specifies formats for encoding floating point data, including sign, exponent, and significand fields¹.
          - Modern CPUs, including those in data centers, adhere to this standard and provide robust floating point capabilities.
      
      2. **Workloads in Data Centers**:
          - You're correct that many workloads in data centers primarily involve **integer computations**, especially in databases, web servers, and routine business applications.
          - However, certain tasks benefit from floating point capabilities:
              - **Scientific Computing**: Simulations, weather modeling, and scientific research often rely on floating point arithmetic.
              - **Machine Learning**: Neural networks and deep learning models use floating point operations for training and inference.
              - **Graphics Rendering**: Video transcoding, image processing, and 3D rendering require floating point calculations.
              - **Financial Modeling**: Complex financial simulations may involve both integer and floating point computations.
      
      3. **Supercomputers and FLOPS**:
          - Supercomputers are measured by their performance in terms of **floating-point operations per second (FLOPS)**.
          - The fastest supercomputers can achieve over **100 petaFLOPS (100 quadrillion FLOPS)**²³.
          - GPUs (Graphics Processing Units) play a significant role in supercomputing due to their massive parallelism and high floating point throughput.
      
      4. **Data Center GPUs**:
          - In data centers, GPUs like the **NVIDIA Tesla V100** deliver exceptional performance with fewer servers and reduced power consumption⁵.
          - While CPUs handle general-purpose tasks (including integer computations), GPUs excel at parallelizable workloads involving both integer and floating point operations.
      
      In summary, while many data center workloads focus on integers, having robust floating point capabilities ensures versatility for handling diverse tasks. It's essential to strike a balance between integer and floating point performance based on the specific workload requirements. 🚀
      
      Source: Conversation with Bing, 2023/10/29
      #+END_QUOTE
    • 依然很蠢,不能理解问题重点。

  • 手动搜了下也没找着这方面有人提起

cocalc.com #investment #math #ideas

  • 看看人家的创业公司

  • 比很多datasci的创业产品强

  • 还自带了GPT

非常好奇算法学家如何工作、如何思考的 #ideas

  • 例如Tarjan🤩

协同设计在机械设计领域发展如何? - 追光几何的文章 - 知乎 #git #ideas #VC

  • MGit,机械设计领域的git

  • 工作流的理念很正确,解释的很清楚

给人脸识别支持ToF #ideas #CV #deepin

comment on anything #ideas #datasci

  • post可引用各种对象

  • post具有评分

    • ∑评价者的credit×vote

  • post的评分也会影响评价者的credit

硬座车充电插座紧缺。。。 #ideas

绝佳的创业案例 千亿像素看中国 #ideas

  • 或许运用了遥感技术?

WPS有一点做的不好,三件套之间还是太缺乏互通了,比如表格的很多调整在word、ppt里没法使用。office的做法值得借鉴,这种复杂软件还能搞出中台那确实相当了得 #ideas

两种相似度:语义相似度与结构相似度,结构相似度类似于对语义相似的求导 #ideas #AGI

集中式知识库,集成日程等信息,而日历等应用相当于从中project出的view #ideas

  • 比如每节课的笔记就ref那节课的实例,而无需手动创建、也无需纠结ref的时候怎么命名(继续xxx啥的)

大纲也不是万能的,还有一种展示需求难以实现,就是修订 #ideas #logseq

  • 具体来说,块引用和内嵌虽然可以引用想修改的块,但还是没法方便的实现inline修改,想inline只能改原文。而很多时候我们希望能区分原文和修改后的结果。

  • 和git那种不同,我更希望修订后的数据自成一体,类似于patch的形式存在。不过这又涉及到原始数据改变造成混乱的问题

怎么评价现在高校的教学型教授? - 知乎 #ideas

  • 高校到底应该以什么为定义评价指标?我认为还是教育。科研呢,是为了教育服务的。以知识为目的的教学就应该以知识传授为第一要务,以能力培养为目的的教学就应该以能力为衡量标准。

  • 研究生教育不是为了高校一时一地的成果,而是为了研究生的学术生涯。因而不能只关注在校期间的成果,后续发展也要长期跟踪,当然也需要剔除不同阶段受到的影响,比如升学去了MIT就不能全归功于本校。

  • 于是教授科研能力与教学能力的关系应是如下:通常成果好的教授会有一些方法上的潜在经验,虽未必能成方法论;但也有成果并不非常出众的教授有好的方法论,也有成果出众的教授毫无章法、全靠风口或是压榨。

信息管理流程处理类软件已经很大程度上能通过低代码生成了,但是低代码画流程图之类的为了调整可看性还是较为繁琐。AI自动布局能够解决随手画图的可读性问题,那么就只需要选择起点、搜索选择终点两个操作就能方便的画图了 #ideas

如何评价Meta/FAIR 最新工作Segment Anything? - 一堆废纸的回答 #AGI #research #ideas

  • 很有意思的角度,data-centric与model-centric,虽然data-centric肯定也会碰到model的上限瓶颈,但用在现有模型上应该有些提升空间

  • 师姐搞的标注那方面工作这不突然成风口了(

很显然数据库类型的workload下更加看重整数性能,包括图查询类型下,而且往往能通过并行加速,然而现有并行化加速基础设施如GPU更加看重浮点性能,是不是可以搞些侧重整数的优化从而减少面积和耗电量? #ideas

为logseq乃至datascript提供cypher、SPARQL等图数据库QL支持 #ideas

  • parser-> AST ->rewriter

长期贩卖 ideas

加强创新与生活实践融合的提案 #ideas #education

  • 现状

    • 上课螺丝钉,创新造飞机

    • 武大仅是一个符号、一个生活环境

      • 智慧校园,数字孪生,遥感与规划

      • 宿舍食堂、校内商业体,咨询建议服务,参与决策规划

      • 校车、校内基建、校内机电设施

      • 校史、文物、

    • 课程高大上,就业老破残

  • 理想

    • 实践是创新的源泉,创新不能脱离实践

    • 切身参与建设,才能更好爱校强校

    • 学界领先业界指导业界

  • 建设创新策源高地,社会育人基地,创业实践田地

根据课表地址及时间段,智能推荐就餐位置,平衡各食堂、门店的频次 #ideas

  • 构建武大基础知识库,便于查找结构化知识 #semantic web

VR+过山车 大创? #ideas

中午看LUG群里分享了zswap #ideas #csarch

  • 还有zram、zcache

  • 算法有zsmalloc、z3fold等

  • 一些趋势

    • 透明压缩使得新层级出现

      • 相对更低的等容成本

      • 稍高的延迟

      • 难直接inplace写

    • 现状的inefficiency

      • 压缩内存->CPU解压->控制器压缩->落盘

      • 省去解压与压缩

        • 内存->控制器压缩->硬盘

        • 压缩内存<->硬盘

        • 硬盘->控制器解压->内存

      • CPU offload

在MPU的中低速总线场景下,或许小规模FPGA控制器+可配置PHY有一定前景 #ideas #embedded

  • 这些控制器所需LUT资源相比于中等性能核不值一提

各级都会做校验,redundant permission check #ideas #research

看到bot报的香山最近修了两三个V相关的bug,同时很多也涉及exception/int/misalign,看起来某些像是能静态扫的👍 #ideas

神奇的机构格局,很有创新性和实验性 #ideas #society

  • 个人认为可以考虑多个维度

    • 知识体系层面的远近亲疏

    • 数理化程度

      • 高阶抽象的、数学模型规范化的、部分数理化的、未数理化的

      • 同层次间或许容易迁移

有没有可能把窗管通上呢?linux的程序也能有阴影、半透明合成效果 #ideas

UGC truthfulness / quality assurance #research #ideas

一些粗浅的 #ideas

  • 不择手段的德萨摩

  • ASI处于临门一脚

  • 气候变迁下的生存危机

  • 政治正确的压迫

    • e.g. 《唐山大地震》救儿子还是女儿

寄存器与内存空间的分与合 #ideas

  • 将寄存器作为地址空间的低位?

  • 通用寄存器的个数?

寻找大佬一起办一个 #ideas

洗澡时候想起,NFC是较为物理直观的交互方式,适老化有前景 #ideas

  • 投屏往电视上贴就有选项

  • 常见功能做些贴纸贴在茶几上

和测试强度很相关,具体怎么个依赖法有所体现 #ideas #hardware

  • 欸,能不能用微架构性能上的metric衡量?

复杂系统中,check可能也并不正确 #ideas

很多都在提dependency constraint,但也要和探索平衡,如何分析展现对constraint的遵循和探索? #ideas

  • 限深度搜索?如果只是找unexpected path,一次性生成过深的violation path大概率无效?注重组合

  • 如果一切约束都是calculated或许会减少一些漏洞?

怎么着想到些ideas

  • 四海为家(or 八方来客)

    • 一种地方文化的商业模式,想到挺久了

      • 不知道有没有类似项目

    • 难点

      • 人际交往能力、时间、冷启动

      • 场地、住宿、社保、教育等

      • 市场推广、媒体资源

      • 巨头竞争优势,包括携程、美团等

  • SBOM使用记录

    • 不经意间从许多开源项目收益,想sponsor不知道给哪些最为合理

    • 尽量降低并发、降低资源消耗

    • 好人假设,用不着区块链那么强的记账

自动进行行为鉴别,实现幂等等特性的修复? #ideas

  • 多端同步也需要这一特性

或者说,我自己的思维头太杂,有时候新开session,开着开着又要合并,又要fork,难管理。这是OS问题 #ideas #OS #AI

路上用平板画了下GraphQL+SPARQL #ideas

这类使用体验上的问题,llm很难解决(根本多少没这方面公域知识,推理起来也太间接) #ideas

TODO interaction network / calculus 有必要学学 #ideas #PL #graph

当年想提案的给食堂开外卖 #ideas

shell的一些问题,下一代系统 #ideas

  • 最头疼的就是长路径,还是缺失了暂存

    • GUI里不同窗口就是暂存

    • 而且有scroll pos等隐变量,无需思考起名

      • 自动pin到某处并自动起名

  • scroll还得靠触摸板,惯性之类的都更加跟手

  • 不够结构化

    • 下一步能输入路径还是option

    • 操作过于扁平,几十个选项没法找

智慧校园共建社区 #ideas

  • 例:校园景观信息

    • 多种切实存在的用途

  • 特点

    • 信息展示对用户体验的重要性

      • 不涉及业务流程,低风险

    • 需求点细而多、松耦合

  • 优势

    • 共建共享良性循环

      • 学生对技术的兴趣

        • 切实可行的实践项目需求

          • 多方竞争

      • 校园文化内容生态

    • 业务场景凝练研究需求

      • (开源)社区协作运营管理

      • 公开信息平台

        • 信息安全

        • 数据治理

          • 细粒度更灵活的访问控制

      • 云原生高效运维托管

ideas
https://blog.graphorall.top/blog/ideas
Author rubbishzyc
Published at May 15, 2026