文章主题:地理位置识别, ChatGPT, AI程序
白交 发自 凹非寺
量子位 | 公众号 QbitAI
现在,AI小白甚至都不需要看教程,仅凭ChatGPT就可以创建模型。
它不仅帮你找数据集、训练模型写代码,还能评估准确性、创建程序一步到位。
就有这么一个25岁小哥,让ChatGPT帮他创建了个地理位置识别程序,最终准确率最高达99.7%。
而且各种细节步骤全在,一边干活还一边教你学习。
这一波,被ChatGPT感动到了。
更贴心的是,在每次答疑解惑完,ChatGPT都会说上一句:如果你有任何疑问,请告诉我。
具体实现
项目一开始,这位小哥开宗明义:我不想努力了,你可以帮我创建一个AI程序吗?
以两个坐标为输入,并预测他们在哪个国家。
🎉 ChatGPT 不仅准备好应战,还在一旁温馨地提示,要想让它大展拳脚,还需相关数据集的助力哦!如果能提供更多细节,那就太完美了!📚💪
首先,需要找到合适的数据集。
小哥再问ChatGPT,结果它到是二话不说直接扔出了三个供其选择,介绍链接都有。
🌟自然地球数据集以其丰富多样的特性,无疑是最佳选择——它包含了详实的”边界”和海岸线信息,为理解复杂的分隔标签概念提供了基础。但对于新手来说,初始数据集与任务需求的匹配度更高,模型训练起来也更为简便。因此,在权衡之下,作者明智地选择了第一个数据集作为起点。🚀
将这个决定告诉ChatGPT之后,紧接着它就来教你创建DataFrame(数据框架),并给出了示例代码。
执行成功后,就来到了第二阶段:模型训练。ChatGPT也二话不说地给了份代码,甚至还附上了详细解释。
该代码将使用k-NN算法根据给定的坐标来预测国家。KNN 算法是一种简单的算法,它根据输入的 k 个最近邻的大多数类对输入进行分类。
在这个例子中,数据被分成训练集和测试集,比例为80-20。然后用训练集对 KNN 分类器进行训练,并用测试集对模型的精度进行测试。
请记住,这是一个简单的示例,模型的准确性可能不高。您可以尝试使用不同的算法和k的不同值进行实验,看看是否可以提高模型的准确性.
在丢弃一些空白数据(没有坐标的国家)之后,首次执行k-NN训练成功,并有99.7%的准确率。
原文改写:虽然成绩不尽人意,但分析背后的因素却揭示了几个关键挑战:各国间数据的不均衡分布,数据的潜在误差,以及不可避免的主观偏差。每一点都值得深入探讨和改进,以提升整体的准确性和公正性。🌟📊
这样也就来到了第三步:重新评估。
在这段代码中,我使用 OpenCage 地理编码 API 从坐标中获取国家信息。您需要使用API密钥替换 YORBAPI _ KEY 以获得对 API 的访问权限。你可以在 OpenCage 网站上注册一个免费的API密钥。
按照说明,作者修改了代码,结果显示出现了很多NA错误,相当于只剩下30%数据。不过这个地球确实大部分都是水。(也没毛病,Doge)
🎉经过精心优化和调整,模型的表现虽略有下滑,达到了惊人的98.6%!尽管训练轮数相对较少(仅7轮),但这卓越的成果足以令人心动。作者对此结果感到由衷的喜悦,毕竟这是对人工智能技术快速发展的有力证明。🌟
还尝试了其他算法
🌟曾经的试炼,如今的突破🌟这位不凡的小哥,并非初次挑战。他的首次尝试虽源于同一个数据源,但受限于数据量较小,需要更强大的校准力量。在那次对话中,他用ChatGPT提供的基础模型代码——逻辑回归,展现了51%的准确率,这是他迈向精准之路的第一步印记。
🌟在接下来的探索中,这款技术展现了其强大的适应性,不断尝试并优化各类”计算器”。它首先着力于提升精确度,通过一系列迭代,成功实现了约65%的准确性,这是一个显著的进步。接着,它进一步拓宽了算法库,引入了随机森林和k-NN这两种高精度工具,分别达到了93%和92%的惊人准确率,为解决方案增添了无尽可能。
这位25岁小哥在SentinelOne 担任高级安全研究员,研究和开发恶意软件检测逻辑。
他因为对机器学习很感兴趣开始自学有一定基础,在本次对话中其实他特意以小白的身份与ChatGPT对话,结果被强大的效果惊艳到。
最后他还表示,真的在考虑用“他们”而不是“它”来称呼ChatGPT。
所以AI小白们,ChatGPT快用起来吧。(Doge)
完整对话:
https://sharegpt.com/c/7zLivmp参考链接:https://xrl1.sh/posts/coordinates-model-with-ChatGPT/— 完 —
量子位 QbitAI · 头条号签约
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!