趣文网 > 作文大全

AI技术应用提速:40余项能力上新升级 赋能复工复产复学有序发展

2020-11-22 23:10:02
相关推荐

春暖花开时,疫情终会过去。百度大脑2月推出 AI 战疫—口罩识别、肺炎影像识别等一系列专项抗疫能力,3月加码升级40余项 AI 能力,在教育、生活领域发挥更大的应用价值。

百度 AI 多人体温检测守住校园防疫“第一道防线”;语音技术助力信息无障碍,让无声世界的教学体验更流畅;泛阅读类 APP 接入百度语音能力满足大众“听书”诉求。更多最新 AI 能力及应用,本文帮你一览全局!文末有彩蛋,AI 能力史无前例限时优惠!

AI+教育:智慧安全校园管理复学,特殊群体同样“停课不停学”

百度 AI 测温、口罩检测、人流量统计为复学防疫提供多项校园安全解决方案——多地明确开学时间,逐渐恢复正常的教学秩序。在师生跨入校园的第一步,校门就是他们的安全防线。如何快速进行测温,保障安全,是亟待解决的重要问题。

百度以 AI 图像识别技术和红外热成像技术为核心的“百度 AI 多人体温检测解决方案”已在多地部署并完成超过数百万人次的快速测温检验。

此前,百度大脑 AI 人脸识别技术已在校园得以应用,如广州市白云区华龙小学曾部署了十牛信息科技公司基于百度大脑 AI 人脸技术开发的“智慧校园 AI 人脸一站式解决方案”。

该方案可使用百度大脑人脸识别技术进行特征识别以核验学生身份,实时统计、无感刷脸考勤,在提高学校考勤工作效率的同时,有效保障校园安全。疫情特殊时期迎来复工复学,戴口罩人脸识别结合 AI 测温的整合解决方案将为学校提供实时、高效的安全防护。

借力百度大脑语音技术推出慧译视频字幕系统,让无声世界的教学体验更流畅——面对新冠肺炎疫情导致的延期开学,一场基于“全民直播”的教学行动正在各地上演。

当大多数学生都能通过直播听课与老师互动交流、答疑解惑时,有一群听力有障碍的孩子们面对直播却十分苦恼,他们听不清老师所讲、没有字幕可看、更无法与老师互动接受指导。

为保障疫情期间的如常学习,专门为听障人士做产品研发与服务的洛阳乐往网络科技有限公司(后文简称“乐往科技”)借助百度大脑语音技术推出慧译视频字幕系统,让被按下“静音键”的听障学生也能跟上“停课不停学”的进度。乐往科技立刻为慧译 APP 接入百度语音技术,集成百度大脑远场语音识别、实时语音识别能力,很好地实现在手机上通过 APP,持续将3-5米之外说话人的声音转化为文字,并具有极高的准确率、极快的识别速度,让听障群体可以和普通人得以进行无障碍沟通。慧译 APP 极大地满足了全国2800多万听障群体的沟通交流需求,而面对此次疫情下的需求乐往科技同样反应迅速。

AI+生活:信息无障碍,“听书”阅读新体验

百度大脑为公益项目开放权益,让每个人享受“信息无障碍”——携手机构/企业/个人一起在“信息无障碍”领域为残障、聋哑、留守儿童、空巢老人等打造软硬一体的 AI 服务。

目前,开发相关的公益项目所使用的 AI 技术能力调用量每天超过1亿次,典型如“AI 导盲眼镜”、“信息无障碍沟通慧译 APP”、“图片智能读屏”等应用, 缩小数字鸿沟,实现所有人平等地使用现代科技,更好的学习、工作、生活。为了进一步加大信息无障碍工作力度,百度大脑开放平台已于19年11月正式推出 AI 公益计划——因 AI 而声。针对具有公益属性的产品和项目,提供更多的资源和技术倾斜。

沉浸书海不间断,语音合成技术日均调用量增加20亿——春节以来,在线阅读迎来“高光时刻”。有声阅读这种适用于多场景和碎片化时间的阅读方式,正在逐渐影响着人们阅读的习惯。

无论是校园教育,还是走入职场后的自我学习,阅读始终都是人们提升能力的重要途径,而借助音频形式,更有助于让优秀文学作品触及更多年轻读者群体。从读书到听书,百度大脑的语音技术既帮阅读软件开拓了全新的阅读场景,也惠及着背后数以亿计的读者,让一键“听万卷”成为现实。

AI+快消:重磅推出快消数字化访销解决方案,全面助力快消品牌商对访销过程进行精细化管理

快消品牌商的终端网点遍布全国,为了确保终端执行的透明度和可控性,开始使用 SFA、DMS 等管理工具进行数字化访销转型,并探索利用 AI 技术对现有的数字化访销实现“降本、增效、动销”。

百度大脑近期推出的数字化访销解决方案是围绕快速消费品企业在线下渠道中的销量逻辑,提供基于拜访、分销、动销等环节的一站式 AI 服务,通过对访销过程的精细化管理,提升一线业务人员人效,最终实现销量的增长;其中包含智能路径规划、门脸识别、翻拍识别、EasyDL 零售版-商品检测、货架拼接、价签识别、票据证件识别等10+专项 AI 能力,并与多家知名服务商及品牌商深入合作, 实现了在访销各业务场景中的落地使用,有效提升终端门店管理与执行的效率和效果,让数据分析更高效精准,有效缩短决策时长,从而实现市场运营与决策的智能化。

40余项 AI 能力上新升级,最高免费赠送10000次调用量

1. 人脸与人体识别:5项能力升级优化,1项新能力开放邀测

人脸私有化部署包升级

支持部署到「本地服务器」的人脸识别模型服务,提供人脸检测、人脸比对、人脸搜索、活体检测等基础功能,支持百万级超大型人脸库,可实现毫秒级响应。支持戴口罩的人脸检测和人脸识别能力,现已优化口罩检测和识别功能,在正脸角度下口罩识别准确率可达到95%。

人脸检测与属性 API 升级

上线口罩检测功能,通过调用人脸检测接口,实现对用户是否佩戴口罩属性的检测,同时配合人脸对比/人脸搜索接口识别戴口罩人身份,可广泛应用于人脸考勤,会员识别等场景。

人体检测与属性识别 API 及私有化服务升级

新增 face_mask 字段,增加口罩检测功能,正面、侧面角度抓拍均支持。疫情期间公共场所口罩佩戴情况检查、各类工厂安全生产规范着装检测均适用。

人体关键点识别模型升级

优化模型效果,提升21个关键点定位的精度,包含头顶、五官、颈部、四肢主要关节部位,支持多人检测、大动作等复杂场景。

人像分割服务升级

增加人体检测功能,以便过滤“无人”时仍强行分割的 badcase,同时优化分割效果(减少白边、误分割等)。

指尖检测开放邀测

检测图片中的手部并返回坐标信息,精准定位食指指尖、及4个辅助关键点的坐标位置。模型针对儿童学习机点读场景进行专项调优,可用于点读搜题、自动跟读等应用。

2. 语音识别:1项能力全面商用,1项能力开放公测

离线语音合成 SDK 全面商用

离线语音合成 SDK 在原有按设备数售卖模式的基础上,新增按产品线授权售卖模式,适用于 APP 类产品,单台价格低至0.5元。离线语音合成能力帮助产品在无网弱网环境下也能流畅合成,适用于阅读听书、资讯朗读、订单播报等场景。多种音色风格充分满足个性化需求,支持中英混读,更有粤语、美式英语专用音库。

音频文件转写开放公测

支持批量上传音频文件识别为文字,12小时内返回识别结果。多采样率多场景声学建模,支持普通话和略带口音的中文识别、支持英文识别。适合录音质检、会议内容总结、音频内容分析等场景。

3. OCR:1项能力正式商用,2项能力开放公测,2项能力升级优化

行程单识别正式商用

支持对飞机行程单的12个关键字段进行结构化识别,包括印刷序号、姓名、始发站、目的站、航班号、日期、票价、民航发展基金、燃油附加费、其他税费、合计金额、填开日期。一次性享有500次免费调用量,超出免费调用量可开通付费功能。行程单识别已于3月27日全面升级并上线计费功能,识别准确率大幅提升,付费方式灵活多样。

机动车销售发票开放公测

支持对机动车销售发票的26个关键字段进行结构化识别,包括发票代码、号码、开票日期、机器编号、购买方信息、车辆信息、销货单位信息、价税合计、价税合计小写、税率、税额、不含税价格等。公测阶段一次性享有500次免费调用量。

公式识别开放公测

支持对试卷中的数学公式及题目内容进行识别,可提取公式部分进行单独识别,也可对题目和公式进行混合识别,并返回 Latex 格式公式内容及位置信息,便于进行后续处理。公测阶段未实名用户一次性赠送1000次;完成个人实名认证,提升至5,000次;完成企业实名认证提升至10,000次。

护照识别升级

生日、姓名、姓名拼音、出生地点、护照号码 识别准确率均提升 40%以上,识别准确率达到 90%以上;失效日期字段提升 35.51%,达到 86.55%;签发地点提升 24.71%,达到91.38%;性别提升 6.25%,达到 100%。

iOCR 自定义模板文字识别平台升级

iOCR 通用版/财会版新增“预置模板”功能,预置对应场景常用的卡证/票据模板,无需制作即可直接调用完成结构化识别;新增关键词辅助分类功能,可填写模板中独有的文字内容,作为模板分类的文字依据,并可结合文字信息与图片特征进行分类器训练,提升模板分类准确率。

4. 图像技术:1项能力正式商用,1项能力升级优化,3项能力开放邀测

人像动漫化升级并正式商用

运用对抗生成网络技术,结合人脸检测、头发分割、人像分割等技术,为用户量身定制千人千面的二次元动漫形象。近期人像动漫化再次升级,能够支持多人效果及戴口罩二次元形象,并正式支持商用。

图像风格转换新增7种转换风格

可将图像转换成卡通画或素描风格,可用于开展趣味活动或集成到美图应用。近期图像风格转换升级,新增7种转换风格:彩色铅笔画风格、哥特油画风格、彩色糖块油画风格、呐喊油画风格、神奈川冲浪里油画、奇异油画风格、薰衣草油画风格。

天空分割开放邀测

天空分割可智能分割出天空边界位置,输出天空和其余背景的二值图和灰度图,可用于二次处理进行天空替换等图片编辑场景,目前已开放邀测。

图像多主体检测能力开放邀测

在原有“单主体检测”服务的基础上,全新推出“多主体检测”服务,支持对图片中的多个主体进行识别框选,输出主体的坐标位置、标签名称及标签置信度得分,支持对框选出的主体进行裁剪,方便进行二次开发,适用于图像处理、提升图像识别精度、海量图片分类打标、辅助智能识图等场景。

绘本图像搜索开放邀测

全新推出了绘本图像搜索能力,针对拍照搜童书场景专项优化算法,支持用局部绘本页面图片,精准检索自建库中对应儿童书本教材,现已开放邀测。

5. 自然语言处理 NLP:2项能力开放邀测

智能招聘解决方案开放邀测

企业招聘解决方案包含简历解析、人岗匹配、人才评估、招聘机器人等多项应用能力,帮助企业节省招聘成本,缩短招聘周期,将 HR 从日常海量简历和琐碎沟通中解放出来。目前【简历解析】和【人岗匹配】可通过官网 demo 测试使用。

【简历解析】:用户上传简历文件,即可完成文本抽取与解析,输出标准结构化的字段,包含基本信息、教育信息、工作信息、项目信息、补充信息五大类共63个字段,大幅提升简历电子化入库效率;

【人岗匹配】:上传岗位需求和简历文件,即可输出岗位与简历的匹配程度,既可以根据简历推荐该求职者最合适的岗位,也可以对岗位推荐最合适的候选人。

智能文档分析开放邀测

依托自然语言处理、OCR、知识图谱技术,可对文档关键内容进行结构化提取,有效识别文书存在纰漏并给出纠错建议和提示,可以进行文档信息对比,还可以依据规则和要求,自动对企业内部文书、合同进行合规性审查,提示更正内容和相关法条推荐,有效提升文档处理效率。

6. 知识图谱 KG:4项能力正式商用,1项能力开放邀测

实体标注能力正式商用

该接口基于百科知识库,将实体链接到知识库中的实体,可用于搜索、推荐、广告、对话等多种场景下的知识解析任务。价格0.6元/千次。

汉语检索能力正式商用

该接口可检索汉语的单字、词语、成语、诗词、古文、俗语歇后语、名言警句等,给出对应的拼音、笔画、释义、组词、百度百科等多个维度解释信息;还可以根据用户的问题给出基于汉语知识场景的解答,例如检索“三个火念什么”、“秋开头的成语”,可精准输出检索结果,回答汉语客观类知识问题。可用于在线阅读、智能硬件、教育培训、小说阅读、新闻出版、写作助手等领域。价格16元/千次。

知识问答能力正式商用

该接口基于海量数据,对用户需求进行深层次、知识化理解,并结合知识查询、推理、计算等多种技术,为用户提供多领域、细粒度的知识问答服务。目前提供娱乐、人物、教育、影视、综艺、动漫、小说、文学作品等垂类问答;以及日期历法、年龄差、身高差、时间时区差等垂类问答。广泛应用用于智能硬件、知识媒体运营、培训教育、泛娱乐等领域。价格60元/千次。

作文检索能力正式商用

该接口基于大量作文范文数据库,可根据作文名称进行模糊查询,结果将给出包含搜索名称相同的优秀作文内容,同时正文内容中将涵盖该作文的点评内容;还可以根据用户提供的检索信息进行查询,例如“描写秋天的作文”“高中议论文”等方式,给出相关的优秀作文内容。该接口可提供6大类文体内容,上百种标签类目,可用于作文仿写、优秀范文学习等场景。价格60元/千次。

资讯事件判别开放邀测

依托全网海量优质数据和行业领先语义判别技术,判断资讯文本中是否包含事件描述并给出置信度,可用于新闻推荐、事件发现、优质资讯筛选等应用场景。

7. UNIT:闲聊技能重磅推出个性化干预能力全新发布

UNIT 为平台预置的闲聊技能设计研发了个性化干预能力,帮助广大开发者在自己的产品中根据使用的场景、业务对闲聊技能的需求定位,进行不同维度和不同程度的个性化干预。不仅能够降低开发者的研发门槛,还能够改善用户的对话体验。

8. 智能创作平台:1项能力优化升级,2项能力开放邀测

结构化数据写作能力升级,内置天气、财经证劵、体育赛事等数据

智能创作平台借助更强大的智能创作引擎技术,内置了天气、基金、债券、足球、篮球、各大股市大盘的数据源,实现了财经、体育、天气、娱乐等类型新闻的自动创作。此外,自动创作还适用于企业内外部数据、行业热点资讯的自动分析与报告生成,通过接入数据、配置专属写作模板,可快速批量地自动生成文章。

辅助创作多项能力开放邀测

新增标题推荐、地域识别、主题短语等功能,可帮助创作者快速精准的发布内容。“标题推荐”功能是指平台可以根据文章内容自荐标题,为用户提供标题拟定思路。“地域识别”是指平台可根据文章内容输出国家、省份、城市等分级地域信息。“主题短语”是指平台可根据文章内容输出反映文章主题的短语,满足榜单等限制标题长度的场景诉求。

多模态创作功能开放邀测,轻松图文转视频

智能创作平台推出的多模态创作功能,可快速实现图文到视频创作,该功能可根据图文内容进行解说词配音,同时获取内容相关视频素材,形成自然流畅的短视频,从而低成本地大幅提升短视频生产效率,满足个性化视频创作需求。该功能已在邀测阶段。

9. 内容审核平台:1项能力优化升级,1项新能力上线

色情识别模型升级

新增裆部特写、臀部特写、脚部特写、孕肚裸露四个标签,从16分类升级为20分类。更灵活适配多样化的需求场景。

人机审核平台

针对拥有人工审核团队的服务商或企业审核团队提供的审核员操作平台。审核员可以在平台上高效的审核各类短视频、图像、文本内容,同时借助AI审核模型提升审核效率,降低企业审核成本。

10.飞桨 PaddlePaddle

PaddleCV 最新全景图首度曝光

其中,PaddleDetection、PaddleSeg、PaddleSlim 和 Paddle Lite 重磅升级;全新发布 3D 视觉和 PLSC 超大规模分类2项能力。同时,PaddleCV 新增了15个产业实践中广泛应用的算法,整体高质量算法数量达到73个;35个高精度预训练模型,总数达到203个。

百度黄埔学院预科班课表出炉

聚焦智能质检、无人巡检、嵌入式安防、大数据预测等场景应用。

百度深度学习7日打卡营第六期

Python 小白逆袭 AI 大神,用深度学习来追星,pick 你最喜爱的“青你2”小姐姐~

11. 一站式 AI 开发平台 EasyDL:1款软硬一体方案上线,多款服务升级

EasyDL-EdgeBoard(VMX)软硬一体方案上线

上线 EasyDL-EdgeBoard(VMX)软硬一体方案,基于英特尔 MX 芯片实现的高性价比 USB 加速计算卡,支持 EasyDL 图像分类、物体检测模型,支持 Linux、Windows 操作系统,1TOPS 端侧 AI 推理算力,软硬件打包仅售699元,满足小型化低成本的设备端模型部署场景需求。

EasyDL——经典版部署服务升级

新增声音分类服务器端 SDK,支持 Linux&Windows 系统 x86&GPU 硬件,适用于本地服务器高性能要求的模型部署场景。

图像分类设备端基础版 SDK,新增支持 Linux 系统 Atlas200 开发板。目前 EasyDL 图像分类 SDK 已支持14种芯片类型和4大操作系统平台,是适配最广泛的 AI 开发平台。

SDK Demo 优化、部署服务提示优化等体验升级。

EasyDL 经典版正式上线多款计费产品

文本分类 API、图像分割 API 全面支持后付费使用。用户可针对自己的模型,根据实际需求选择「按量后付费」。

图像分类、物体检测、文本分类、声音分类、图像分割 API 接口正式发布「API 次数包」和「QPS 叠加包」能力,满足业务场景的高并发需求。

EasyDL 零售版正式上线多款计费产品

正式上线 API 服务「QPS 叠加包」、「购买调用量次数包」。

商品陈列翻拍接口正式发布按调用量后付费、调用量次数包预付费和 QPS 叠加包预付费三种计费方式,调用量0.04元/次起,每 QPS 40元/QPS/日起。

EasyDL 专业版定制模型挑战赛正式开赛

面向有算法基础的 AI 开发者,使用 EasyDL 专业版完成模型训练或部署,鼓励选手们着眼计算机视觉 CV 或自然语言处理 NLP 的实际业务场景,融合 AI 模型能力与业务需求,通过使用百度 EasyDL 专业版,通过其内置的百度海量数据训练的预训练模型,以少量数据获得更优的训练效果,创造出价值卓群的模型。比赛到4月30日截止,千元礼金和百度自研计算卡丰厚好礼。

EasyDL 深度学习实战营系列直播公开课

2月12到3月25日,EasyDL 开展了深度学习实战营系列直播公开课。从技术解析到实战演练,EasyDL 经典版4次直播课,帮助没有任何算法基础的初学开发者,了解深度学习的基本原理,并结合实际应用场景,完成 AI 需求分析、模型定义、模型训练及服务部署实操,快速开发 AI 模型。EasyDL 专业版6次直播课,帮助具备一定的算法基础、想要掌握提升 AI 模型开发的进阶知识的开发者,进一步掌握 NLP、CV 多种模型任务的算法网络结构与调优技巧。

12. 深度学习开发与实训社区 AI Studio

Notebook 环境支持飞桨最新版本PaddlePaddle 1.7.1

Notebook 多项功能升级

a)Notebook 内新增资源监控功能,方便了解训练过程中实时资源使用情况。

b)Notebook 内新增显示 cell 运行耗时和完成时间选项,提升训练体验。

c)Notebook 内上传文件最大体积由30MB升至150MB,使文件上传操作更加方便。

公开项目新增“运行一下”功能

当您浏览他人公开项目时,可使用此按钮,直接完成从 Fork 到项目启动环境的全流程,方便您直接查看项目运行效果。

公开项目评论支持上传图片和代码

公开项目评论支持上传图片和代码,方便进行更多形式的交流。

课程支持添加小型比赛

支持在课程中添加小型比赛,此类比赛作为考试的一种特殊形式, 与课程内容相结合,激励学生学习。

课程新增内置视频资源库

教育版内置视频资源库,使用 AI Studio 开课的教师可直接使用,方便顺利启动教学活动。

多个比赛上线,多重豪礼等你来拿

a) 2020语言与智能技术竞赛火热上线,本次大赛分为五个子任务,总奖金高达35万,欢迎前来挑战。

b) EasyDL 专业版定制模型挑战赛上线,分为 CV 和 NLP 两个方向,综合应用创新立意、数据丰富度、模型准度、场景应用性和商业价值进行评比。

AI 市场

丰富的 AI 上下游产品聚集地,无缝对接买卖双方,撮合交流,快速应用。

AI 市场首页新品推广位全新上线

AI 市场首页为最新上架商品提供轮播宣传位,每个新品均有7天免费推广期,商品越新、信息越完善,推广位置越靠前。服务商可利用7天曝光期,快速让优质新品脱颖而出。客户也可以在新品区获得 AI 市场最新商品动态,选择心仪商品,助力项目快速落地!

百度 AI 市场质服务商入驻及商品发布

北京众合天下、深圳易晨、北京思图场景、成都睿瞳、福州品度、广东互动智能等多家优质服务商入驻 AI 市场,上线并售卖抓拍机、人脸识别门禁、镜头模组、智能机器人等硬件产品,以及智能体温检测通行、智能化个税申报服务机器人,车辆特征识别解决方案,性价比高,品质有保障。

a)防疫卫士 ThermoBot 复工开学神器

高流量公共空间防疫佳选!

b)车服门店专用车牌识别相机

集车牌识别、摄像、前端储存、补光于一体,是智慧车服行业首款专用车牌识别产品。

c)51社保-智能化个税申报服务机器人

百度 AI 技术和 RPA 技术相结合,在国内首次实现了一套机器人代码覆盖全国主要城市个税申报。

文末福利

AI、云、大数据产品一折起购,OCR 身份证识别低至五折、人脸离线识别 SDK 直降至139元/个(原价299元/个)。

阅读剩余内容
网友评论
相关内容
延伸阅读
小编推荐

大家都在看

关于传承的作文素材 写人作文300字左右 关于母爱的作文题目 骑自行车作文300字 付出与收获的作文 写西湖美景的作文 我很感激他作文 五年级下册读后感作文 跌倒作文600字 收获作文600字初中 家乡美景作文500字 写冬天的作文400字 我的好朋友作文开头 记忆中的年味作文 那一次我流泪了作文 不一样的中秋作文 我的假期作文400字 品味遗憾作文 游记怎么写400字作文 冬景作文600字 除夕习俗作文 我最喜欢的一首歌作文 运动使我快乐作文 关于成长感悟的作文 洗碗作文100字 五年级下册四单元作文 最喜欢吃的食物作文 我喜欢的季节英语作文 有趣的事作文600字 我的爸爸作文100字