以稳定、安全、快捷的高品质服务和良好口碑获得广大用户的喜爱和认可。j9九游会秉承创新、高效的运营信条而不断努力!Devin 展示的才略特地惊艳-九游会(中国区)集团官方网站

栏目分类

热点资讯

新闻动态你的位置：九游会(中国区)集团官方网站 > 新闻动态 > 以稳定、安全、快捷的高品质服务和良好口碑获得广大用户的喜爱和认可。j9九游会秉承创新、高效的运营信条而不断努力!Devin 展示的才略特地惊艳-九游会(中国区)集团官方网站

以稳定、安全、快捷的高品质服务和良好口碑获得广大用户的喜爱和认可。j9九游会秉承创新、高效的运营信条而不断努力!Devin 展示的才略特地惊艳-九游会(中国区)集团官方网站发布日期：2024-04-27 08:20 点击次数：194

机器之心报谈

作家：泽南、小舟

不到 24 小时，Star 量逼迫 1400。

最近，有好多东谈主在为 AI 代替我方的职责而担忧。

上个月火遍 AI 圈的「首位 AI 圭臬员」Devin，应用大模子才略还是掌持了全栈手段，仅需要东谈主类给出当然讲话指示，就不错自动完成复杂的代码任务。

Devin 展示的才略特地惊艳，不外这款器具出自走闭源阶梯的创业公司，当前唯唯一小部分得到了内测限额的东谈主能力使用。

本周二，来自普林斯顿大学 NLP 组的参谋东谈主员放出了 SWE-agent —— 一个开源版 AI 圭臬员，不到一天就得到了上千的 GitHub Star 量。

SWE-agent 是一款用于自主处罚 GitHub 存储库中问题的新系统。它在 SWE-bench 上得到了与 Devin 相似的准确度，平均耗时为 93 秒。

技俩网站：https://swe-agent.com/GitHub：https://github.com/princeton-nlp/SWE-agent

该项策作为家 John Yang 示意，联系论文的预印版也将在 4 月 10 号上传。

从旨趣上看，SWE-agent 通过将大模子（举例 GPT-4）鬈曲为软件工程智能体，不错确立确凿 GitHub 存储库中的诞妄和问题。

在完竣的 SWE-bench 测试集上，SWE-agent 处罚了 12.29% 的问题，已毕了 SOTA 性能。

为了提供征战经过中的自动化，SWE-agent 通过与专用末端交互来职责，它不错翻开、搜索文献践诺，使用自动语法搜检、剪辑特定行，也不错编写并实行测试。

该项筹办征战者悉心瞎想了 UI 界面，并在 GitHub 上进行了先容。

智能体 - 计较机接口 (ACI)

参谋团队瞎想了通俗的以大模子（LM）为中心的敕令和反映体式，使大模子好像更便捷地浏览存储库、稽查、剪辑和实行代码文献，这被称为智能体 - 计较机接口 (ACI)。参谋团队还构建了 SWE 智能体存储库，以便应对迭代存储库级编码智能体的 ACI 瞎想。

就像讲话模子需要邃密的请示工程（prompt engineering）相同，邃密的 ACI 瞎想在使用智能体时会带来更好的轨则。莫得经过邃密退换的 ACI 的基线智能体的阐扬比 SWE-agent 差得多。

SWE-agent 包含参谋团队在智能体 - 计较机接口瞎想经过中发现的特地灵验的功能，包括：

1. 添加一个在发出剪辑敕令时驱动的 linter，淌若代码语法不正确，则不会让剪辑敕令通过。

2. 为智能体提供一个特意构建的文献稽查器。参谋团队发现此文献稽查器在每轮仅露出 100 行时服从最好，何况该文献剪辑器具有凹凸滚动以及在文献中实行搜索的敕令。

3. 为智能体提供特意构建的全目次字符串搜索敕令。参谋团队发现该器具简约地列出匹配项特地热切 —— 只需列出至少有一个匹配项的每个文献。该参谋标明，向模子露出关联每个匹配的更多凹凸文关于模子来说太杂沓了。

4. 当敕令的输出为空时，复返一条音书：「您的敕令已得胜驱动，但未产生任何输出」。

改日发布的论文将胪陈更多信息。

装配与使用

要使用 SWE-agent，领先要竖立好如下条目：

1. 装配 Docker，并在土产货启动 Docker；

2. 装配 Miniconda，并使用 conda env create -fenvironment.yml 创建 swe-agent 环境；

3. 使用 conda activate swe-agent 激活；

4. 驱动 ./setup.sh 创建 swe-agent docker 镜像；

5. 在此存储库的根目次下创建一个 keys.cfg 文献并填写以下践诺：

OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'

ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'

GITHUB_TOKEN: 'GitHub Token Here (required)'

SWE-agent pipeline 包含两个要领：

第一步：SWE-agent 领受输入的 GitHub 问题，并复返尝试确立它的拉取苦求（pull request）；第二步：评估拉取苦求以考据它确乎处罚了问题（当前仅适用于 SWE-bench 基准测试中的问题）。

淌若思在通盘这个词 SWE-bench 上驱动和评估，最通俗的递次是使用 x86 机器。

python run.py --model_name gpt4 \\

--data_path https://github.com/pvlib/pvlib-python/issues/1603 --config_file config/default_from_url.yaml

python run.py --model_name gpt4 \\

--per_instance_cost_limit 2.00 \\

--config_file ./config/default.yaml

淌若思驱动 SWE-bench 中的单个问题，不错使用 --instance_filter：

python run.py --model_name gpt4 \\

--instance_filter marshmallow-code__marshmallow-1359

上一篇：以稳定、安全、快捷的高品质服务和良好口碑获得广大用户的喜爱和认可。j9九游会秉承创新、高效的运营信条而不断努力!拉特克利夫爵士取消了俱乐部高管的公司信用卡-九游会(中国区)集团官方网站

下一篇：以稳定、安全、快捷的高品质服务和良好口碑获得广大用户的喜爱和认可。j9九游会秉承创新、高效的运营信条而不断努力!而荫藏处则广博浮浅资本-九游会(中国区)集团官方网站