每日聚焦:工程师利用GPT-4,实现对 AI 可穿戴设备进行编程
站长之家 2023-05-19 17:06:54


(相关资料图)

编程客栈(www.cppcns.com) 5月19日 消息:Project Ring 是一款腕戴式小型计算机,它使用 AI 实时分析环境,并进行文本描述,再通过 ChatGPT 对环境进行评估。

这款可穿戴设备结合了语言和图像模型,以提供人与 AI 之间更流畅的交互体验。

根据开发人员 Mina Fahmi 的说法,该项目旨在“展示低摩擦交互,将人类与人工智能之间编程客栈的物理和数字信息融合在一起。”

为此,Fahmi 构建了一个带摄像头和操纵杆的腕戴式小型计算机,可以使用Replicate image-to-text 模型对环境进行实时可视化分析,用文本python进行描述,并通过ChatGPT对其进行评论。

整个过程中,使用 Eleven Labs 的文本转语音服务将文本转换为语音,然后通过 安卓智能手机传输到骨传导耳机。耳机有一个内置麦克风,允许用户对可穿戴设备说话,例如,询问有关环境的问题。使用OpenAI 的 Whisper将用户的语音转换为文本,以便 ChatGPT 参与智能评论。所有数据都在谷歌云中处理。

Fahmi 称他使用GPT-4完成了 Project Ring 的所有代码生成。语言模型总共生成了大约750行代码。其中包括用于 RASPberry Pi 的 python 脚本、云应用程序、网站和 android 应用程序。

需要注意的是,Fahmi 有编码背景,但他已经很多年没有写过任何代码了。他相信项目表明使用 GPT-4来编写完整的编程客栈软件原型是可能的,虽然不是一件容易的事情。

该项目还强调了人工智能通过提供对环境的实时描述和评论来改善有视觉或听觉障碍的人的无障碍环境的潜力。

项目展示了人工智能自动化编码任务和创建完整软件原型的潜力。它还强调了人工智能增强人机交互和提供体验世界的新方式的可能性。

每日聚焦:工程师利用GPT-4,实现对 AI 可穿戴设备进行编程

2023-05-19

澳大利亚媒体:对南太构成威胁的可不是中国

2023-05-19

集中钨钼、新能源材料和稀土核心版块,厦门钨业退出房地产行业

2023-05-19

世界今日报丨支撑科技创新!我国电磁学领域首发新刊

2023-05-19

抵押权预告登记的权利人享有优先受偿权吗 全球观速讯

2023-05-19

山东钢铁董秘回复: 宝武集团与山钢集团重组,是宝武集团与山东省国资委筹划实施的战略重组

2023-05-19

钱大妈官方电话_钱大妈官网电话

2023-05-19

“能出声,就能干这事儿!”业内反省:脱口秀是如何自食恶果的

2023-05-19

新音乐榜2023原创嘉年华 平安获最受欢迎男歌手

2023-05-19

高位肛瘘手术多少钱(肛瘘手术一般多少钱)

2023-05-19

天天讯息:豪杰之士肝胆照人的意思是_豪杰之士 肝胆照人的意思

2023-05-19

lol手游游戏id怎么改 LOL手游ID怎么改

2023-05-19

全球观焦点:联合国宗旨与原则_联合国宗旨

2023-05-19

中国电研:5月18日融券卖出1.33万股,融资融券余额1.16亿元_环球时讯

2023-05-19

AI时代,我们如何读鲁迅

2023-05-19

世界要闻:带花的古诗句哪些 带花的古诗句有哪些

2023-05-19

哔哩哔哩怎么邀请好友一起看电影(哔哩哔哩怎么邀人一起看)_环球热文

2023-05-19

实时:Rookie:“我被Maerk打了”!Beryl皮肤赢麻

2023-05-19

十三大常委已落马四位是谁_资讯推荐

2023-05-19

两难抉择!斯基拉:京多安收到曼城续约报价,也收到巴萨合同报价

2023-05-19