知行编程网知行编程网  2022-07-15 19:00 知行编程网 隐藏边栏 |   抢沙发  31 
文章评分 0 次,平均分 0.0

Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式

来自 | 量子位
又一款懒人神器问世了:
Visual Studio Code的扩展,基于CodeBERT的Python文档字符串生成器。
Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式
看来现在,这群偷「懒」的程序员们连文档字符串都不想自己写了。


   基于CodeBERT的生成器

跟正常的DocStrings用法一样,你只需要输入三引号「“””」,之后按Enter,便能调用这个工具。就像这样:
Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式
并且,这个生成器还可以在几种不同类型的文档字符串格式之间进行选择。
Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式
而这个工具,不仅仅能够帮助写代码的人,还可以方便后来人读代码。可以说是非常方便的一个扩展了。
这个工具的本质,就是一个自然语言识别的AI,它能够识别你所写代码的内容,然后输出对应的字符串。
具体是如何识别的,该AI的作者是这么介绍的:
参数类型是通过PEP 484类型、默认值和var标签进行识别的。
识别输入之后便是推断,这之间进行训练的方法,也并不复杂,通过CodeBERT便可以实现。
CodeBERT是一种双模预训练模型,它可以捕捉自然语言和编程语言之间的语义连接,是目前已知的第一个大型 NL-PL(自然语言-编程语言)预训练模型。
在训练过程中,使用 CodeSearchNet 语料库作为训练数据,并使用 CodeBERT 中的 Code2NL微调任务。
之后,进行的推断基准测试如下:
Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式
从上图也能看出,在不同的推断基准测试中,所需要的生成时间都很短(2s内),这体现在操作上的话,就是延迟。
目前,这个生成器可以支持识别args、kwargs、decorators和errors等参数类型。
此外,还可以输出Google、docBlockr、Numpy、Sphinx等Docstring格式,PEP0257类型的格式,也即将上线。


   使用方法

1、从容器中运行模型推断服务
具有GPU的话:在安装nvidia-docker后,运行docker run-it-d-GPU 0-p 5000:5000 gray kode/ai-docstring
只有CPU:运行docker run-it-d-p 5000:5000 gray kode/ai-docstring
2、在VSCode中安装扩展并使用
光标必须在定义正下方的行上,以生成完全自动填充的文档字符串。
用三重引号「“””或‘’’」打开文档字符串后,按Enter键;
键盘快捷键是ctrl+shift+2,Mac为cmd+shift+2


   网友讨论

该生成器一经发布,便引起了网友们的讨论。
有网友认为这是一项非常便利的技术,非常期待:
Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式
不过,也有网友认为这项技术仍具有不小的局限性:
Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式
比如这位网友认为:更常见的注释,是在代码中没有立即出现的上下文之间添加内容。
不过,虽然有局限,但是人总是在「懒」的过程中变得更「懒」(狗头)。
比如jQuery的流行,是因为开发者懒得为DOM编写跨浏览器兼容性代码;
而之后Angular.js的流行,是因为开发者连DOM都懒得操作。
所以,还是非常期待这个扩展的后续,这些程序员能不能针对这些局限性进一步偷懒的。


   获取资源

目前这个扩展已经在Visual Studio Code上免费上线。
进入链接即可获取资源:
https://marketplace.visualstudio.com/items?itemName=graykode.ai-docstring
也可以通过Github获取源文件:
https://github.com/graykode/ai-docstring

<section data-brushtype="text" style="padding-right: 0em;padding-left: 0em;white-space: normal;letter-spacing: 0.544px;color: rgb(62, 62, 62);font-family: "Helvetica Neue", Helvetica, "Hiragino Sans GB", "Microsoft YaHei", Arial, sans-serif;widows: 1;word-spacing: 2px;caret-color: rgb(255, 0, 0);text-align: center;"><strong style="color: rgb(0, 0, 0);font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;"><span style="letter-spacing: 0.5px;font-size: 14px;"><strong style="font-size: 16px;letter-spacing: 0.544px;"><span style="letter-spacing: 0.5px;">—</span></strong>完<strong style="font-size: 16px;letter-spacing: 0.544px;"><span style="letter-spacing: 0.5px;font-size: 14px;"><strong style="font-size: 16px;letter-spacing: 0.544px;"><span style="letter-spacing: 0.5px;">—</span></strong></span></strong></span></strong></section><pre><pre><section style="letter-spacing: 0.544px;white-space: normal;font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;"><section powered-by="xiumi.us"><section style="margin-top: 15px;margin-bottom: 25px;opacity: 0.8;"><section><section style="letter-spacing: 0.544px;"><section powered-by="xiumi.us"><section style="margin-top: 15px;margin-bottom: 25px;opacity: 0.8;"><section><section style="margin-bottom: 15px;padding-right: 0em;padding-left: 0em;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 25.5938px;letter-spacing: 3px;text-align: center;"><span style="color: rgb(0, 0, 0);"><strong><span style="font-size: 16px;font-family: 微软雅黑;caret-color: red;">为您推荐</span></strong></span></section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;">一文了解深度推荐算法的演进</section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;">干货 | 算法工程师超实用技术路线图</section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;"><span style="font-size: 14px;">13个算法工程师必须掌握的PyTorch Tricks</span></section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;"><span style="font-size: 14px;">吴恩达上新:生成对抗网络(GAN)专项课程</span><br  /></section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;">拿到2021灰飞烟灭算法岗offer的大佬们是啥样的<span style="font-size: 14px;">?</span></section></section></section></section></section></section></section></section></section>

Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享