“我用 ChatGPT,在 120 秒内做了一个飞机观测器!” 华为天才少年稚晖君首秀:首款人形机器人亮相,上得厨房入得工厂,成本价不到20万元
ChatGPT与地理

“我用 ChatGPT,在 120 秒内做了一个飞机观测器!” 华为天才少年稚晖君首秀:首款人形机器人亮相,上得厨房入得工厂,成本价不到20万元

作者 | LOUISON DUMONT 译者 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 我的儿子 18 个月大了,他最喜欢看天上的飞机。每次听到飞机引擎的声音,他就会抬头看。当他发现飞机的那一刻,他通常会兴奋地用手指着它说 ” 看!” 或 ” 飞机!” 之类的话。 既然他这么喜欢飞机,我也知道飞机的位置是公开数据,所以我想写一个有趣的脚本:每次有飞机飞过头顶时发出警报,这样我们就可以跑出去找到它了。 不到两分钟,功能原型就有了 那是一个周日下午,我给他换了尿布,把他交给他妈妈小睡一会儿,然后在中午 12:10 打开了我的笔记本电脑。我打开了 ChatGPT,并问道:” 我想构建一个工具,当我的房子上方有航班经过时,它会向我发送通知。请帮我用 NodeJS 构建这个工具。” 很快,一个 NodeJS 代码就返回来了,其中包含适当的 API 调用、距离计算功能和通知系统: 我输入了经度 / 纬度,并执行了它,本以为 API 调用很可能会中断,但让我惊喜的是,它马上就运行了,并提醒我附近有一架飞机。 我看了看时间:12:12。整个过程还不到两分钟,我脑子里就有了一个功能原型。我们果然生活在一个疯狂的时代。 本来我可以自己来做这件事,找到合适的 API,弄清它的响应结构,并计算出每个响应与我的位置之间的距离——这需要 30 分钟,但现在我却以 30 倍的速度完成了这项工作。 然后,我就想:这工具很有趣,看看可不可以在其他设备上使用。于是我问...
ChatGPT App重大进化!能看能听还会说,多模态模型细节同时公布量子位2023-09-26 10:22北京量子位2023-09-26 10:22北京
ChatGPT与地理

ChatGPT App重大进化!能看能听还会说,多模态模型细节同时公布量子位2023-09-26 10:22北京量子位2023-09-26 10:22北京

梦晨 发自 凹非寺量子位 | 公众号 QbitAI OpenAI连发两则重磅消息,首先ChatGPT可以看、听、说了。 新版ChatGPT开启一种更直观的交互方式,可以向AI展示正在谈论的内容。 比如拍一张照片,询问如何调整自行车座椅高度。 官方还给出另一个实用场景思路:打开冰箱拍一张照片,询问AI晚餐可以吃什么,并生成完整菜谱。 更新将在接下来的两周内向ChatGPT Plus订阅用户和企业版用户推出,iOS和安卓都支持。 与此同时,多模态版GPT-4V模型更多细节也一并放出。 其中最令人惊讶的是,多模态版早在2022年3月就训练完了…… 看到这里,有网友灵魂发问:有多少创业公司在刚刚5分钟之内死掉了? 看听说皆备,全新交互方式 更新后的ChatGPT移动APP里,可以直接拍照上传,并针对照片中的内容提出问题。 比如“如何调整自行车座椅高度”,ChatGPT会给出详细步骤。 如果你完全不熟悉自行车结构也没关系,还可以圈出照片的一部分问ChatGPT“说的是这个吗?”。 就像在现实世界中用手给别人指一个东西一样。 不知道用什么工具,甚至可以把工具箱打开拍给ChatGPT,它不光能指出需要的工具在左边,连标签上的文字也能看懂。 提前得到使用资格的用户也分享了一些测试结果。 可以分析自动化工作流程图。 但是没有认出一张剧照具体出自哪部电影。 △认出的朋友欢迎在评论区回复 语音部分的演示还是上周DALL·E 3演示的联动彩蛋。 让ChatGPT把5岁小朋友幻想中的“超级向日葵刺猬”讲成一个完整的睡前故事。 △DALL·E3演示 ChatGPT这次讲的故事文字摘录如下: 过程中更具体的多轮语音交互细节,以及语音试听可参考视频。 多模态GPT-4V能力大揭秘 结合所有公布的视频演示与GPT-4V System Card中的内容,手快的网友已经总结出GPT-4V的视觉能力大揭秘。 物体检测:GPT-4V可以检测和识别图像中的常见物体,如汽车、动物、家居用品等。其物体识别能力在标准图像数据集上进行了评估。文本识别:该模型具有光学字符识别 (OCR) 功能,可以检测图像中的打印或手写文本并将其转录为机器可读文本。这在文档、标志、标题等图像中进行了测试。人脸识别:GPT-4V可以定位并识别图像中的人脸。它具有一定的能力,可以根据面部特征识别性别、年龄和种族属性。其面部分析能力是在 FairFace 和 LFW 等数据集上进行测量的。验证码解决:在解决基于文本和图像的验证码时,GPT-4V显示出了视觉推理能力。这表明该模型具有高级解谜能力。地理定位:GPT-4V 具有识别风景图像中描绘的城市或地理位置的能力,这证明模型吸收了关于现实世界的知识,但也代表有泄露隐私的风险。复杂图像:该模型难以准确解释复杂的科学图表、医学扫描或具有多个重叠文本组件的图像。它错过了上下文细节。同时也总结了GPT-4V目前的局限性。 空间关系:模型可能很难理解图像中对象的精确空间布局和位置。它可能无法正确传达对象之间的相对位置。对象重叠:当图像中的对象严重重叠时,GPT-4V 有时无法区分一个对象的结束位置和下一个对象的开始位置。它可以将不同的对象混合在一起。背景/前景:模型并不总是准确地感知图像的前景和背景中的对象。它可能会错误地描述对象关系。遮挡:当图像中某些对象被其他对象部分遮挡或遮挡时,GPT-4V 可能无法识别被遮挡的对象或错过它们与周围对象的关系。细节:模型经常会错过或误解非常小的物体、文本或图像中的复杂细节,从而导致错误的关系描述。上下文推理:GPT-4V缺乏强大的视觉推理能力来深入分析图像的上下文并描述对象之间的隐式关系。置信度:模型可能会错误地描述对象关系,与图像内容不符。同时System...
操作系统级ChatGPT爆火,实测让电脑自己整理桌面,Mac/Windows/Linux都支持
ChatGPT与地理

操作系统级ChatGPT爆火,实测让电脑自己整理桌面,Mac/Windows/Linux都支持

操作系统级ChatGPT,微软还没搞出来,被开源项目先实现了—— 支持Windows、Mac、Linux三大系统,相当于直接和你的电脑对话。 打开凤凰新闻,查看更多高清图片 指定文件夹下打开终端,一句话,所有Word文件秒变PDF。 与单个文件互动,直接拖拽进来就行。 与应用程序互动也不在话下,一句话读取系统日历、整理日程并发到指定邮箱。 甚至从头写一个本不存在的番茄钟应用,写好直接就能用上了。 这个神器,就是开源版代码解释器Open Interpreter,一经发布就冲上过GitHub热榜第一,到现在已累积1.8w星。 现在更是开启了桌面版的提前排队,这下不熟悉终端操作的朋友也能轻松在图形界面下使用了。 (作者透露已排队500+,感兴趣的抓紧了) 开源版GPT-4代码解释器 作者Killian Lucas,初衷是利用GPT-4 API做一个开源的极简版代码解释器。 通过本地运行,来绕过OpenAI官方版的诸多不便之处,例如: 3小时只能发25/50条消息 预安装的Python包有限,不能联网安装新的 上传文件不能超过100MB,运行时间限制120秒 会话环境无法长时间保留,文件将会被清除 以上这些限制在Open Interpreter这里通通不存在了,只需一个API Key就能把GPT-4的强大与本地开发环境的灵活结合在一起。 有GPU的更是可以在本地跑Code-Llama等开源大模型。 作者最近就演示了在断网情况下用Falcon-180B做数据可视化,还是可交互的。 现在Killian对Open Interpreter的愿景是“让人人都能编程”,而且是用自然语言代替写编程语言。 如果想尝试一下,如果有装Python只需“pip install open-interpreter”就可以开始了。 当然实际情况下,还是建议在虚拟环境中安装,避免复杂的包依赖问题。 首次运行,会提示输入OpenAI API Key, 或直接回车选择免费的Code-Llama,有7B、13B、34B三个版本可选(会自动到Hugging Face上下载)。 接下来就可以开始使用了,比如整理一下乱糟糟的桌面。 为了安全起见,执行代码之前要输入y同意,同意之前可以先看一眼。 如果AI干活你确实放心,也可以启动时添加-y参数,后面所有代码默认直接执行。 不过涉及删除等操作时还是要小心,已经有人想删一个目录下的所有json文件,结果把电脑里所有json文件都删了。 –fast则是使用gpt-turbo-3.5的意思,不然默认会使用GPT-4。 GPT-4虽然强,但API价格还是很高的,有网友就分享了一不注意玩掉20多美元的经历。 相比之下gpt-turbo-3.5就便宜的多,刚刚反复测试了半天,也就花掉8美分。 哦对了,还记得刚才的虚拟环境是怎么设置的吗? 没记住也没关系,以后再也不用记了,只需要让Open Intepreter帮你设置就行了。...
云从科技发布从容大模型,与ChatGPT对比中考真题答题澎湃新闻2023-05-18 15:52
ChatGPT与地理

云从科技发布从容大模型,与ChatGPT对比中考真题答题澎湃新闻2023-05-18 15:52

·人工智能发展趋势中,首先突破的是人工智能的单点技术,2015年最重要的单点技术是人脸识别,但在单点技术解决需求的时代,市场空间相对有限。人工智能第二浪是多点技术闭环,探索用AI真正改变产业和生活,但每个场景海量研发,投入产出比不平衡。在AI的第三浪,内容和交互革命,实现流量重构,技术平台化、标准化,边际成本基本为0,这个时刻就是AI进入大模型时代,AI开始像人一样思考和工作。 从容大模型写作文。5月18日,人工智能平台公司云从科技(688327)在广州发布从容大模型,展示从容大模型的对话、编程、阅读、中考真题答题等基础能力。 从容大模型目前处于内测阶段,现场演示环节中,对话展示了中文作文写作、英文招领启事写作、中英文翻译等能力。长文档阅读可完成内容概括,根据书籍内容进行人机互动,展示跨模态能力。 从容大模型与ChatGPT答2022年广东省中考历史真题。 从容大模型与ChatGPT答2016年甘肃省兰州市中考地理真题。在中考客观题答题环节,针对2022年广东省中考历史真题、2022年四川省德阳市中考生物真题、2016年甘肃省兰州市中考地理真题,从容大模型与ChatGPT同时答题,对比答题速度和正确率。演示结果显示,从容大模型答题速度相对更快,错误率相对较高。对300道题目的答题结果显示,云从从容大模型正确率71%,ChatGPT正确率73.34%,GPT4.0正确率86.34%。云从科技创始人周曦表示,目前GPT4.0的水平明显高于其他大模型,云从科技在大模型方面要走的路还很长,值得学习的内容很多。 从容大模型、ChatGPT、GPT4.0答题正确率。“没有强大的基础大模型,直接去做行业大模型不具有长期持续的生命力。”周曦表示。基于从容基础大模型,云从科技与政务、制造、金融、游戏等领域协作构建行业大模型。在数字政府领域,从容大模型的基层治理场景应用包括面向民众服务的一语智办、面向应用开发者的编程助手、面向城运治理中心的融合指挥、面向网格队伍的智治精灵。例如城运指挥大屏AI精灵,通过智慧蓉城天府新区运行中心演示了城市游玩建议等能力。 在智能制造领域,利用大模型构建智能维修伴随系统,推进维修计划科学合理。维修前对设备精准判断,根据图文视频、此前的维修要点等预习;维修过程中完成监管督导,判断维修是否存在遗漏;维修工单关闭后进行维修检测记录,包括生成图文视频维修记录、复盘本次维修,为下次维修提供支持。目前云从科技与中国检验认证(集团)有限公司共建数字质量大模型。 在智慧金融领域,云从科技表示,从容大模型将银行海量数据资源转化为有价值的信息,突破专业知识供给瓶颈,提升银行在普惠金融、银行运营能力、服务实体经济方面的能力。比如在支持普惠金融方面,大模型是入口,简约化智慧网点、线上APP等渠道;数智营销对理财等产品的营销活动和内容实现个性化触达;智能客服可问答、完成业务,满足合规要求。 在C端业务方面,大麦数字人直播平台探索一站式自助直播解决方案,设置互动问答库应对粉丝提问,主播可挑选话术风格。 云从科技创始人周曦谈AI发展趋势。“大约10年前,深度学习的突破带来了人工智能的突破。2016年,围棋人工智能程序AlphaGo战胜围棋世界冠军李世石,全世界掀起新的AI热潮。”周曦表示,人工智能的发展趋势中,首先突破的是人工智能的单点技术,比如2015年最重要的单点技术是人脸识别,百家争鸣不断竞争形成了“AI四小龙”(商汤科技、云从科技、旷视科技、依图科技),但在单点技术解决需求的时代,市场空间相对有限。人工智能第二浪是多点技术闭环,解决更多需求,探索用AI真正改变产业和生活。但带来的问题是不够标准化,每个场景需要海量研发,导致AI公司大量投入,但投入产出比不平衡。 在AI的第三浪,内容和交互革命,实现流量重构,“技术平台化、标准化,边际成本基本为0。一个统一的核心技术底座大平台能够快速改变海量场景和海量应用,原有的场景和产业的内容、交互方式会全面变革。”周曦表示,这个时刻就是AI进入大模型时代,AI开始像人一样思考和工作,大模型时代的交互方式总体有问答、伴随和托管三种类型,内容变革上带来了生成式AI。“像人一样思考和工作的AI,真正做到知行合一,总体来讲有三个关键步骤:一是物理世界数字化,真正把物理世界和数字世界打通。二是知识找人,知识能够精准为每个人在合适时间服务。三是能陪伴执行,不能只是纸上谈兵的系统,而是能够方便快捷地为人类提供最好的服务。”他表示,因此首先要构造一个像人一样思考和工作的操作系统,而从容大模型是操作系统能力板块的重要一环。 (本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP) 举报/反馈
首张黄金签证花落“ChatGPT之父”:东南亚最大经济体所图甚大?
ChatGPT与地理

首张黄金签证花落“ChatGPT之父”:东南亚最大经济体所图甚大?

财联社9月5日讯(编辑 潇湘)周二(9月5日),有着“ChatGPT之父”之称的OpenAI首席执行官山姆·奥特曼(Sam Altman),成为了首张印尼“黄金签证”的获得者。目前,印尼这个东南亚最大经济体,正在积极寻求吸引更多的海外投资者。 印尼移民局局长Silmy Karim在一份声明中表示,印尼移民局向奥特曼签发了为期10年的黄金签证,因为他“在国际上享有盛名,并可能会为印尼带来利益”。 这位ChatGPT的联合创始人,未来将得以享受机场优先安检、可在当地逗留更长的时间、更便捷的出入境流程等优厚待遇。 目前,尚不清楚奥特曼的黄金签证是否是由他主动申请的,也不知道他是否已有计划在印尼进行大规模投资。 自去年首次亮相以来,OpenAI的生成式人工智能聊天机器人ChatGPT,利用庞大的数据中心展示了类人智能的潜力,从而刺激了全球范围内对人工智能支持基础设施的投资狂潮。 根据德国研究公司Statista的数据,相较2020年,印尼的生成式人工智能市场已增长了10倍,居东南亚之首。据估计,印尼市场接下来将继续以近30%的年增长率扩张,预计2030年会达到11.5亿美元。 印尼所图甚大? 当然,虽然首张黄金签证花落“ChatGPT之父”,但印尼推出“黄金签证”的终极目标,显然并不仅仅局限于AI领域。 印尼的“黄金签证”政策是上周末才刚刚宣布出台的。印尼法律与人权部周日(9月3日)发布的声明显示,“黄金签证”是一种为期5至10年的居留许可。 对于不打算在印度尼西亚设立公司的个人投资者而言,要获得居留期为5年的黄金签证,申请人必须在印度尼西亚政府、上市公司股票或储蓄或存款上投资35万美元,投资70万美元(约509万元人民币)的投资者,则可以获得10年居留权。 同时,投资至少250万美元设立公司的个人也可以获得五年期签证,或者投资500万美元设立公司,则可以获得10年期签证。在该国设立公司的董事和专员,如果其公司投资2500万美元,就有资格获得5年期签证;如投资5000万美元,可获得10年期签证。 印尼旅游和创意经济部长桑迪亚加在今年5月时曾表示,推出“黄金签证”旨在吸引更多数码、保健、研究和技术领域的优秀人才前往印尼,这项政策不仅能吸引更多外国人才和投资,还能为印尼创造更多就业机会。 美国、爱尔兰、新西兰和西班牙等世界其他国家,早年间也为投资者推出过类似的“黄金签证”,以此吸引资本和创业型居民。 Karim在当地时间2日发布的新闻稿中表示,“这些国家都感受到了黄金签证政策实施带来的积极影响。希望通过这项政策,印度尼西亚未来也能受到类似的影响。而且,我们的国家有巨大的管理和发展潜力。” 举报/反馈
爆火的ChatGPT,是如何评价郑大的?
ChatGPT与地理

爆火的ChatGPT,是如何评价郑大的?

最近一位多才多艺的“全能网友” ChatGPT火出了圈 据说它是一个“全能选手” “上知天文,下知地理” 会聊天、撰写论文、创作诗歌 就连编写程序代码等 都不在话下 和TA“聊过天”的网友 纷纷感叹 “只有你想不到 没有ChatGPT办不成的” 刚刚 小郑和ChatGPT进行了一场对话 看看它是怎么评价郑大的? 小郑 请问你知道郑州大学吗?  ChatGPT 是的,郑州大学是一所位于中国河南省郑州市的综合性大学,创建于1928年,是一所具有较高学科综合实力和良好师资队伍的大学。该大学的学科涵盖工、理、文、法、经、管、医、教育、艺术等多个领域,拥有博士、硕士、本科和专科等多个层次的教育机构,是中国教育部和河南省政府共建高校。 小郑 你可以为郑州大学写一首诗吗?  ChatGPT 当然可以,以下是我为郑州大学写的一首诗: 黄河滚滚向东流, 郑州大学显英豪。 华夏文化百年传, 学子才华赋清高。 学堂门庭显荣耀, 科研创新展风骚。 学子勤奋显神采, 师资雄厚智慧高。 优秀学风激昂壮, 校园风景美如画。 人才培养显特色, 海纳百川展宏图。 郑州大学,辉煌未来, 砥砺前行永不忘。 携手同心创未来, 锐意进取展风光。 小郑 新学期,请为郑大学子鼓鼓劲吧~ ChatGPT 亲爱的郑州大学的学子们,新学期开始了,我想对大家说: 在新的学期里,要坚定信心,迎接挑战,勇于探索,不断超越自我,做一个有梦想、有担当、有责任的人。我们相信,你们在郑州大学的求学之路上一定会遇到许多困难和挑战,但只要你们始终坚守初心,勇敢前行,一定会走得更远,成为更好的自己。 同时,我们也要时刻关注身边的同学,互帮互助,共同进步。在这个大家庭里,你们有无数的伙伴,可以相互激励、相互扶持,在学习和生活中相互帮助,一起度过一个难忘而美好的大学时光。 最后,祝愿所有的郑州大学的学子们在新的学期里,取得优异的成绩,拓展自己的视野,做出更多的贡献,让自己的青春在郑大绽放!加油! 小郑...
OpenAI 正为 ChatGPT 测试内容审核功能,可减少人工参与
ChatGPT与地理

OpenAI 正为 ChatGPT 测试内容审核功能,可减少人工参与

品玩8月16日讯,据 OpenAI 官方消息,OpenAI 近日正在为 GPT-4 测试内容审核功能,帮助用户提高审核工作的效率。 该功能将允许用户通过 OpenAI API 来创建自己的 AI 辅助审核系统,通过制定一定的审核政策,让人工智能来对帖子的内容并进行评判。OpenAI 表示,借助 AI 辅助审核系统,可以实现更快地策略优化的反馈闭环以及更少的人工审核人员参与。 OpenAI 表示,使用GPT-4的帮助进行内容审核可以更快地迭代策略变更,将周期从数月缩短到数小时。
ChatGPT将取代搜索引擎?OpenAI首席执行官亲自作出回应
ChatGPT与地理

ChatGPT将取代搜索引擎?OpenAI首席执行官亲自作出回应

ChatGPT前进的一小步,是AI前进的一大步。日前,美国 AI 实验室 OpenAI 推出 AI 聊天程序 ChatGPT,它不仅上知天文下知地理,还能够根据聊天内容与用户进行互动。据计研数字了解,ChatGPT仅发布一周用户数就突破 100 万人,月访问量达 2100 万人次,获得市场高度关注。 计研 正因如此,有关ChatGPT是否会成为下一代搜索引擎的讨论非常多,一部分人认为,ChatGPT上线后,可以帮助用户实现程序生成、文本创作以及代码编写,实现“模糊搜索”到“精准推送”的跨越,具有方便、快捷、便于交互、安全且生态完善的特点,符合用户对搜索引擎的需求。 计研 当你询问ChatGPT对于一些社会问题的看法,它可以从“广大群众”的角度,通过客观理论的推理来进行解释,提供具有社会价值的答案。 举个简单例子,你想知道“未来有多少岗位将被人工智能所取代”,原先的你会在搜索引擎里输入关键词后,需要在众多的内容里去筛选对比找到合适的答案,而现在,你只需要在ChatGPT输入问题,它会直接回答你。 计研 那么它究竟会不会取代搜索引擎呢?日前,OpenAI创始人兼首席执行官Sam Altman给出了回答:ChatGPT不会取代搜寻引擎,但相信未来AI系统或许能够做到。Altman还指出,目前的ChatGPT仍处于非常早期的阶段。 虽然ChatGPT还处于测试阶段,短期内将不会对传统信息检索工具造成冲击,但如果未来ChatGPT的内容质量和训练程度进一步提高,搜索引擎可能会迎来一轮新的技术革命,而谷歌、百度、搜狗、360 等将成为第一个被冲击的对象。 计研 或许是预料到这个危机的到来,不少企业开始着手布局相关业务。 谷歌于2月6日宣布推出人工智能聊天机器人Bard,与当下流行的ChatGPT展开竞争。百度方面官宣推出类ChatGPT应用、自然语言处理大模型新项目“文心一言”(ERNIE Bot),将于三月份完成内测,面向公众开放。计研将持续关注后续相关信息,带来更多行业热点分析。
谈谈ChatGPT 背后的核心技术
ChatGPT与地理

谈谈ChatGPT 背后的核心技术

输入几个简单的关键词,AI能帮你生成一篇短篇小说甚至是专业论文。作为上知天文下知地理对话语言模型,最近大火的ChatGPT在邮件撰写、视频脚本、文本翻译、代码编写等任务上强大表现,让埃隆·马斯克都声称感受到了AI的“危险”。 最近大火的ChatGPT的计算逻辑来自于一个算法名字叫Transformer。它来源于2017年的一篇科研论文《Attention is all your need》。本来这篇论文是聚焦在自然语言处理领域,但由于其出色的解释性和计算性能开始广泛地使用在AI各个领域,成为最近几年最流行的AI算法模型,无论是这篇论文还是Transformer模型,都是当今AI科技发展的一个缩影。 这也是我想在这里给大家分析这篇文章的核心要点和主要创新的初衷。 但我非AI(数学,计算机)专业,只是梳理并分享自己学习的体会和思考,与大家一起讨论,欢迎各位多提宝贵意见;所述并不专业,各位大牛可以绕行。 从Transformer提出到“大规模预训练模型”GPT(Generative Pre-Training)的诞生,再到GPT2的迭代标志Open AI成为营利性公司,以及GPT3和ChatGPT的“出圈”;再看产业界,第四范式涉及到多个重要领域比如生物医疗,智能制造纷纷有以Transformer落地的技术产生。在这个浪潮下,我的思考是: 一是,未来很长一段时间在智能化领域,我们都将经历“科研、算力、基础架构、工程、数据、解决方案”这个循环的快速迭代;流动性、创新性短期不会稳定下来,而是会越来越强。 我们很难等到科技封装好,把这些知识全部屏蔽掉,再去打磨产品。未来在竞争中获胜的,将是很好地“解决了产品化和科研及工程创新之间平衡”的团队。我们一般理解的研发实际上是工程,但AI的实践科学属性需要团队更好的接纳这种“流动性”。因此对所有从业者或者感兴趣智能化的小伙伴了解全栈知识成了一个刚需。 二是,通过对这篇论文的探讨,可以更直观地理解:在科研端发生了什么,以什么样的速度和节奏发生;哪些是里程碑?是科学界的梅西横空出世,带我们发现真理;哪些是微创新?可能方向明确了,但还有很多空间可以拓展;哪些更像炼金术?仍然在摸索,尚需要很长一段时间,或者一直会保持这个状态。 三是,在AI领域,由于技术原因,更多的论文是开源代码的,一方面,促进了更多人参与进来改进迭代;另一方面,科研跟工程实现无缝连接,一篇论文可以拉动从核心代码到平台,到具体应用很大范围的价值扩散。一篇论文很可能就是一个领域,一条赛道,甚至直接驱动业务价值和客户价值的大幅提升。 四是, AI技术发展有很多领域(感知,认知,感知又分图像、语音、文字等,认知也可以分出很多层次),之前这些领域的算法逻辑存在很大差别,Transformer的出现有一定程度上推动各个领域汇聚的迹象,介绍清楚这篇文章,对把握整体,可能有些作用。另外ChatGPT属于现象级应用,大家更有直观感受,未来这类应用的体验提升和更新速度只会更快,理解了其背后的逻辑,更有助于我们把握这个趋势。 介绍 下面步入正题,开始介绍这篇论文,会涉及一些技术细节及公式,可能还需要仔细看一下,相信一旦看进去,你会对AI的理解加深很多。总体把握 这篇论文的结构非常精炼,提出问题,分析问题,解决问题,给出测试数据。顶刊文章讲究言简意赅,有描述,有代码,有结果;其中最核心的是以下这张图,作者团队提出Transformer的核心算法结构: 整篇文章就是围绕这张图来进行解释的,由于篇幅所限,我们聚焦在一条主线上:1、文章想解决主要问题是什么;2、如何解决的;3、从文章提出的解决方案作为一个案例来引发整体思考,因此我们将内容简化,主要关注核心部分。 这张图表达的内容如果理解了,那基本上你掌握了这篇论文85%的内容,也是最关键的部分。 《Attention is all your need》在编写时主要是为了考虑NLP任务,是由几个Google的科研人员一起完成的,其中一个背景是Google也在推广自己的并行计算芯片以及AI TensorFlow开发平台。平台主要功能特点是并行计算,这篇文章的算法也是在最大限度的实现并行计算。我们就以一个简单的例子来把这个算法串一遍。 核心内容 需求是我们需要训练一个模型,进行中文到英文翻译。 背景知识:这个需求要把“翻译:我爱你 to I love you”转置成一个y=f(x)问题,x代表中文,y是英文,我们要通过训练得到f(),一旦训练成功f(),就可以实现翻译。大家拼的就是谁的训练方法更准确,更高效,谁的f()更好用。 之前自然语言处理主要的算法叫RNN(循环神经网络),它主要的实现逻辑是每个“字”计算之后将结果继承给第二个字。算法的弊病是需要大量的串行计算,效率低。而且当遇到比较长的句子时,前面信息很有可能会被稀释掉,造成模型不准确,也就是对于长句子效果会衰减。这是这篇文章致力于要解决的问题,也就是说这篇文章有训练处更好的f()的方法。联想一下ChatGPT可以做论文,感受一下。 在Transformer里,作者提出了将每个字与句子中所有单词进行计算,算出这个词与每个单词的相关度,从而确定这个词在这个句子里的更准确意义。(这句话要是理解了,后面其实可以不看了。) 在此处,要开始进入一些技术细节,在开始之前,我们有必要再熟悉一下机器学习领域最核心的一个概念——“向量”。在数字化时代,数学运算最小单位往往是自然数字。但在AI时代,这个最小单元变成了向量。这是数字化时代计算和智能化时代最重要的差别之一。 举个例子,比如,在银行,判断一个人的信用额度,我们用一个向量来表示: 向量是一组数据的集合,也可以想象成在一个超高维度空间里的一个点。一个具体的信用额度向量,就是在8个特征组成的高维空间的一个点。数据在高维空间将展现更多的数学性质比如线性可分,容易让我们抓住更多隐藏的规律。 向量的加减乘除是计算机在进行样本训练是最主要的计算逻辑。第四范式一直强调的高维,实时,自学习,其中高维就是把企业信息拉升到一个非常高维的空间,变成向量。 Transformer模型的主要意义就是找到了一个算法,分成三步把一个词逐步定位到了一个高维空间,在这个过程中赋予这个单词比其它算法更优的信息。很多情况下这个高维空间有着不同的意义,一旦这个向量赋予的信息更准确更接近真实情况,后面的机器学习工作就很容易展开。还拿刚才信用额度向量举例子: 这两个向量存在于两个不同的向量空间,主要的区别就是前者多了一个向量特征:“年薪”。可以思考一下如果判断一个人的信用额度,“年薪”是不是一个很重要的影响因子? 以上例子还是很简单的,只是增加了一个特征值,在Transformer里就复杂很多,它是要把多个向量信息通过矩阵加减乘除综合计算,从而赋予一个向量新的含义。 好,理解了向量的重要性,我们看回Transformer的三步走,这三步走分别是:1、编码(Embedding);2、定位(Positional encoding);3、自注意力机制(Self-Attention),这个真的大名鼎鼎。...
ChatGPT 对测绘地理信息行业产业的影响以及测绘地理信息在新形势下的数字化转型之路
ChatGPT与地理

ChatGPT 对测绘地理信息行业产业的影响以及测绘地理信息在新形势下的数字化转型之路

测绘地理信息企业的生存现状受到多方面的因素影响。下面是对测绘地理信息企业生存现状的详细描述: 1. 技术发展与创新:随着科技的不断进步,测绘地理信息企业需要不断跟进并应用新技术。例如,高分辨率卫星遥感、激光测量、无人机等新兴技术为测绘地理信息行业带来了更高的数据精度和作业效率。企业需要投资于技术创新,引进先进的设备和软件,并持续提升技术能力,以满足客户需求并保持竞争优势。 2. 市场竞争:测绘地理信息行业市场竞争激烈,企业需要提供差异化的产品和服务来满足不同用户的需求。市场竞争主要体现在价格、质量、交付时间等方面。企业需要不断寻求创新和优化,提高产品质量,减少成本,提高交付速度,以与竞争对手保持竞争优势。另外,近期大部分测绘项目没有首付,以及后续回款难,这些问题导致很多企业难以为续,特别是疫情的三年,加重了这种现象的出现。虽然,自然资源部经常进行开展拖欠测绘地理信息企业账款清欠工作,但效果甚微。 3. 数据安全与隐私保护:测绘地理信息企业处理和管理大量敏感数据,包括土地信息、建筑信息和基础设施信息等。数据安全和隐私保护成为企业的重要任务。企业需要制定合适的数据保护政策,采取有效的安全措施,保护客户数据的安全性和隐私,防止数据泄露和滥用。 4. 政策环境:政府对测绘地理信息行业制定了一系列政策法规和规范,这些政策直接影响着企业的运营和发展。企业需要了解并遵守相关政策,获取合法资质和许可,遵循行业规范,以确保企业的合规运营,并及时调整业务模式以符合政策要求。 5. 人才与技能:测绘地理信息行业需要拥有高素质的人才和专业技能。人才的招聘、培养和保留是企业生存和发展的关键。企业需要吸引和留住技术专家和高级工程师,培养新人才,提供持续的学习和发展机会,以保持企业的竞争力和创新能力。 6. 市场需求变化:随着经济和社会的发展,市场对测绘地理信息的需求也在不断变化。企业需要时刻关注市场动态,了解行业的发展趋势和新兴需求,及时调整产品和服务,以满足市场需求,拓展新的业务领域,增加收入来源。 7. 国家经济发展:国家经济的发展水平直接关系到测绘地理信息行业的需求和发展前景。经济繁荣时期通常会刺激土地开发和基础设施建设,从而提高测绘地理信息的需求。企业需要密切关注经济形势和发展趋势,调整业务策略,灵活应对市场需求的变化。 8. 国家政策扶持与投资力度:政府对测绘地理信息行业的支持和投资力度也会影响企业的生存现状。政府的政策扶持、投资项目和招标标准等都可能为企业提供更多发展机遇。有利于行业内企业稳定发展的政策和资金支持是推动测绘地理信息企业生存的重要保障。 9. 环境保护与可持续发展意识:环境保护和可持续发展已经成为全球关注的重要议题。测绘地理信息企业需要适应这一趋势,注重环境友好型的测绘技术和解决方案。企业需要积极推动绿色测绘、低碳工作方式,以满足社会对环保的要求,并树立企业可持续发展的形象。 10. 国际合作与市场拓展:随着全球化的加剧,测绘地理信息企业面临拓展海外市场的机遇与挑战。与国外企业的合作、技术交流与共享,能够进一步提升企业的技术能力和国际竞争力。同时,积极参与国际标准制定和行业协作,有助于扩大企业在国际市场的影响力。 总之,测绘地理信息企业的生存现状受到诸多因素的综合影响。企业需要具备技术创新能力、市场敏锐度、政策遵循性以及环境保护意识等,以适应快速变化的市场环境,持续提供高质量的产品和服务,保持竞争优势,实现可持续发展。 测绘地理信息行业一直以来都是在不断发展和创新的领域,而近年来,人工智能技术的快速发展为该行业带来了许多机遇和挑战。其中,ChatGPT作为一种具备自然语言交互能力的人工智能模型,对测绘地理信息行业产生了深远的影响。 首先,ChatGPT在自动处理和解读数据方面发挥着重要作用。传统上,测绘地理信息行业需要消耗大量的时间和人力资源来处理和解读复杂的地理数据。然而,借助ChatGPT,测绘专业人员可以利用其强大的语言模型,自动化地处理和解读大数据,从而提高工作效率和准确性。此外,ChatGPT还可以自动生成地理数据分析和报告,进一步提升工作效率。 其次,ChatGPT对实时数据分析和决策支持也产生了积极影响。测绘地理信息行业的决策往往需要基于大量的地理数据进行分析和判断。借助ChatGPT的实时数据处理和分析能力,该行业能够更准确地理解和预测地理变化,为决策提供更精准的支持。同时,ChatGPT的模型可以进行数据模拟和预测,帮助规划和决策过程,减少不必要的错误和风险。 此外,ChatGPT对于测绘地理信息行业的数据安全和隐私保护也具有重要意义。大规模的地理数据往往涉及到用户隐私和敏感信息,因此保护数据安全至关重要。ChatGPT可以运用智能技术,识别和防止数据泄露、未经授权的数据访问等问题,加强测绘地理信息行业的数据安全和隐私保护能力。 另外,ChatGPT还能够增强用户体验。通过对话交互的方式,ChatGPT可以为用户提供个性化和即时的服务。用户可以直接与ChatGPT进行互动,解答问题、提供建议等,从而提高用户体验和满意度。 在新形势下,测绘地理信息行业需要进行数字化转型以适应快速发展的技术和市场需求。以下是测绘地理信息数字化转型的关键步骤和方法: 首先,数据采集和整合是数字化转型的基础。测绘地理信息行业需要采用各类传感器和设备进行数据收集,如卫星遥感、激光测量等。同时,将不同来源的数据进行整合和统一格式化,建立一致性的数据集。 其次,数据存储和管理是数字化转型的重要环节。建立高效的数据存储和管理系统,包括云端存储和分布式数据库等,以提升数据的可访问性和可重用性。通过数据标准化和元数据管理,确保数据质量和一致性。 接下来,数据分析和应用是数字化转型的关键步骤。运用机器学习和人工智能技术处理和分析地理数据,提取有价值的信息。开发各类应用程序和工具,支持地理数据的可视化、模拟和决策支持等,以帮助测绘地理信息行业更好地利用数字化技术实现数据的优化利用。 此外,整合与共享也是数字化转型中的重要环节。通过建立数据共享平台和开放接口,促进各方数据的整合和共享。同时,建立行业标准和规范,推动地理信息的广泛应用和交流。通过整合和共享数据,测绘地理信息行业能够更好地实现数据的互通互联,加速创新和发展。 最后,持续创新和发展是数字化转型的持续任务。随着技术的不断进步和行业的变革,测绘地理信息行业也需要紧跟时代的步伐。引进新的技术和方法,不断推陈出新,开拓创新应用领域,加强人才培养和技术交流,提高测绘地理信息行业的数字化能力和核心竞争力。 综上所述,ChatGPT作为一种自然语言交互的人工智能模型,对测绘地理信息行业产业产生了多方面的影响。它可以自动处理和解读数据,提供实时数据分析和决策支持,加强数据安全和隐私保护,并增强用户体验。随着测绘地理信息行业的数字化转型,数据采集和整合、数据存储和管理、数据分析和应用、整合与共享以及持续创新和发展成为关键步骤和方法。通过数字化转型,测绘地理信息行业能够更好地适应新形势下的发展需求,并实现更高效、精确和创新的地理信息服务。 在数字化转型的过程中,测绘地理信息行业还可以考虑以下方面: 首先,加强数据质量和精度控制。数字化转型需要确保数据的准确性和一致性,因此行业应加强数据质量和精度控制措施。这涉及到采集设备的校准和验证、数据采集过程的质量管控、数据处理和分析的验证等方面。 其次,探索新的数据获取和处理技术。随着技术的不断发展,测绘地理信息行业可以积极采用新兴的技术和传感器,如无人机、激光雷达、卫星遥感等,来获取更多样化和高精度的地理数据。同时,借助人工智能和机器学习技术,可以对大数据进行深度学习和智能分析,提高数据的价值和应用效果。 第三,注重数据标准和互操作性。在数字化转型中,制定和遵循统一的数据标准和规范对于数据的共享、整合和互操作性至关重要。行业内各个组织和机构可以合作制定和推广数据标准,以确保数据在不同系统和平台之间的一致性和无缝集成。 另外,加强人才培养和技术更新也是数字化转型中的重要环节。测绘地理信息行业需要培养具备数字化和数据科学技能的专业人员,他们能够熟练运用人工智能技术和大数据分析工具,理解业务需求并应用相应技术解决方案。同时,持续更新和学习最新的技术和行业发展趋势,以保持行业的领先地位。 最后,积极参与行业合作和创新生态建设。测绘地理信息行业应积极参与行业组织、标准制定机构和科研机构的合作,共同推动技术创新和应用。建立开放的创新生态系统,与其他相关行业进行跨界合作和创新,共同推动测绘地理信息行业的数字化转型。 综上所述,数字化转型为测绘地理信息行业提供了新的机遇和挑战。通过加强数据质量控制、探索新的技术、注重数据标准和互操作性、加强人才培养和参与行业合作,测绘地理信息行业能够更好地应对新形势下的数字化转型,并实现更高效、精确和创新的地理信息服务。 希望此文章对您有帮助,如果您感觉对您或他人有帮助,请分享给更多的人。 关于我们 欢迎关注微信公众号:“opengis“,本公众号旨在传播opengis的理念和推广开源GIS的,让更多爱好开源GIS受益,社区群:QQ群(71480861、371741433),有一群有趣有料的小伙伴在等你哦!欢迎投稿:opengis001@163.com。 进群方式:关注“opengis”后,回复“小助手“,加“opengis.文强”哥,微信回复“进群”,即可进群。