还在为12306验证码烦恼吗?搜狗搜索来帮你!
发布时间:2018-10-09
“12306的验证码,已经击败了全国99%的购票者,我已经找不到回家的路了…”随着春运抢票高峰期来临,12306验证码识别成为用户讨论的热点。日前,搜狗浏览器、浏览器等应用相继推出抢票功能,帮助用户“秒购”火车票,助力这些“抢票神器”排除验证难题,订票成功的技术支持, 正是搜狗搜索开放给合作伙伴的“图像验证码识别解决方案”。
有媒体报道指出,12306临时加强了验证码难度后,目前网络购票用户一次答对的正确率仅为5%,大波儿网友自己制作各种搞趣图片来吐槽12306验证码难度“逆天”。12306验证码与普通验证码不同,不仅要识别图片中的问题,还需要在8张备选图片中选出正确答案。这类“图像匹配验证码”的机器识别,对技术水准要求极高,需要精准的图像识别能力,对于抢票软件而言,着实带来了一道难题。
搜狗搜索推出的“图像验证码识别解决方案”,借助搜狗深厚的识图搜索技术积累,和强大的大数据处理能力,采用“OCR技术+图像分类技术”组合拳,对图像匹配验证码的识别正确率可达99%,并能在0.3秒内可极速完成识别。
而想要在仅仅0.3秒内完成验证码识别,是一项非常具有难度的技术挑战,需要完成两次技术“攻关”和多项技术组合应用
: 首先,要正确识别12306验证码,首先要读懂问题中的文字,这就需要采用OCR技术,即光学字符识别技术。OCR识别的步骤可以分为两步:首先是文本检测(Text detection),将文字从图片中提取出来;然后,对文本进行识别(Recognition)。搜狗输入法的拍照输入、搜狗搜索的识药方等功能,应用的正是搜狗领先的OCR技术。
其次,还需要对候选图片进行识别判断,基于深度学习和大数据分析处理能力的图像分类技术正好解决这一问题。在OCR技术的基础上,搜狗搜索借用了图像分类的思想,首先将经过变形处理的描述文字图像通过OCR技术识别成文本,再通过图像分类技术,对于多张候选图像识别出其分类信息,然后将文本和分类信息进行自动匹配,从而实现验证码的自动识别过程。
这样,凭借“OCR技术+图像分类”这套组合拳,搜狗搜索的“图像验证码识别解决方案”有效解决了12306验证码的破解问题,当然并非一日之功,目前搜狗识图搜索已将“深度学习”技术应用于图像识别领域,通过模拟人认知图片的过程,多层次地模拟和学习,大幅提高了图片分类和识别的准确性。另一方面,搜狗面向全网图像标注而积累的大数据,也为搜狗图像识别精度大幅提升奠定了坚实基础。
此次搜狗搜索开放输出该项技术,在搜狗浏览器、浏览器等产品上应用“图像验证码识别解决方案”,为抢票功能实现解决关键问题,有效提升浏览器抢票功能的效率,惠及众多用户。图像识别技术能够更便捷和智慧地满足用户的搜索需求,在丰富的场景中应用前景广阔,未来搜狗搜索将以开放的态度,通过技术合作等形式,将创新的搜狗识图技术开放给更多互联网应用,连接多元使用场景,助力合作伙伴进一步提升产品体验。
多年互联网服务经验
大连网站制作团队
中小型企业互联网供应商
服务行业领域超过70个
品牌传播与互联网技术并重
网站建设、品牌推广品牌公司:大连新图闻科技有限公司是一家互联网服务提供商, 企业网络服务品牌,也是企业邮箱品牌“盈世”的大连地区代理商。公司成立于2007年, 致力于为企事业单位及个人提供互联网解决方案。公司服务项目包括网站建设、网络营销推广、 宣传册设计、商业摄影、企业邮箱等,帮助客户高速应用互联网技术,提高企业综合竞争能力。

咨询热线:186-0984-0880

市场部 : 8001@newtwowin.com 业务联系,业务需求请发到此邮箱.

QQ咨询: 94091176

客服部:xxz@newtwowin.com

地址:大连市沙河口区西安路罗斯福B座3109
在我们的对手消耗大量的时间停留在碎片化的互联网设计或者程序实现的时候,我们已经开始把数 字化品牌建设和网络传播进行了整合。只有通过整体的互联网品牌分析,帮助客户进行互联网品牌 建设,并传播企业品牌,并围绕品牌树立品牌价值,提升企业与用户的互相交流,与用户品牌交互,让 用户能找对的方法去解决问题。传播品牌,激起消费者品牌意识,在这过程中创造价值,这是我们成 功的秘诀,也是我们帮助用户成功的诀窍,更是成就好的品牌的一条直达线。