腾讯把12亿用户都变成了免费的“标注民工”。
拿验证码当标注系统,让用户免费标注,其实在远古时代,就已经不是什么新鲜事了,但是用生成式AI来跟验证码做结合,这确实还是我,所看的头一回。
它最成名的项目,就是用验证码来数字化海量的书籍和旧报纸。那时候的Ocr真的不咋地,而且很多年前的书和报纸那糊的真的差强人意。
当时,reCAPTCHA系统会向用户在验证码上,展示两组扭曲的单词,其中前面的一组是计算机已经识别的,另一个是计算机难以识别的。
如果用户正确输入前半部分,那么 reCAPTCHA就会假设用户输入的后半部分也是正确的,然后把录入结果返回至reCAPTCHA的项目主机。
结果返回主机后,主机还会把这个结果再派发给多个用户进行交叉验证,以确保没有不小心或故意输错单词的情况。
这大概就好像,让几百万个人每人为给你干5秒钟活儿,然后一分钱都不给一样,你说这是不是已经,把白嫖玩到极致了。
当然最离谱最好玩的,得数15年的12306,当时开脚本抢票的太多,12306的流量压力实在太大,被逼的开启了神迹级的验证码,据说人类首次正确率仅为8%,得错3次以上的人占比有65%。
现在做的,还是最基础最简单的分类,我们标起来,还是挺轻松的。毕竟里面都知道,左上角是鸭子,中间是老虎,左下角是蜜蜂,右下角是赛车。
其实你会看到有两张都跟多肉有关,而根据定语,一簇,更符合左上角第一张图,右上角那个其实不是一簇是一堆,但是我选了他,依然能过。
而且现在明显还是初期,给的prompt和图,都非常的简单,标注的难度也不高,甚至一些大厂的标注模型直接机标可能都应付的过来。
甚至另外几个选项给你的也不是差异这么大的动物汽车啥的,给你的都是菊花、杜鹃花、喇叭花、玫瑰花,来吧你就选吧,加油啊标注民工。
要知道,标注真的很贵的,之前跟国内一家做AI绘图大模型的公司聊过,才知道他们标注分为机标和人标,而人标的成本,大概是数据量的十分之一。
不过这种标注,目前来看还是只能解决语义理解的标注,但是能把这个解决也已经很牛逼了,虽然美学一般,但是语义理解能达到极强,这就是妥妥的国内版Dalle3。
第一波获得用户,而且获得的还是一大波的有美学背景的专业用户,然后每次你生图的时候给你生成4张图拼一块的一张整图,你还必须选一张你觉得最好的进行提取或优化。
所以Midjourney在如今的美学表现上一骑绝尘,是因为他们在美学的标注上,做的太好了,而别的家想在这块赶上,基本不可能,因为最高质量的那波用户,基本已经全在Midjourney那了。
腾讯缺专业用户吗,怎么可能会缺,12亿用户捏在手上,用户画像做的那么齐全,我想把有设计师背景的用户挑出来,难吗?一点都不难。
唯一问题就是,腾讯内部有点封闭,用户画像数据PCG做QQ的那边肯定有,但是混元跟PCG不是一个事业群,也不知道能不能拿得到。。。
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
快科技8月1日消息,国家广播电视总局今天公布了2024年上半年广播电视服务业主要数据情况。经初步统计,上半年全国广播电视服务业总收入6683.57亿元,同比增长7.00%。全国广播节目播出时间756.16万小时,电视节目播出时间888.53万小时。截至6月末,全国有线亿户。大屏直播用户日均活跃率较2023年上半年提高了1.19个百分点。资料显示,全国有线年曾跌至1.99亿户。据了解,新兴收视方式加入竞争,是导致有线电视实际用户流失的主要原因。因为有线电视
6月20日,腾讯旗下两款手游「塔瑞斯世界」和「王者荣耀」登顶美国iOS手游下载榜。两款产品都已经在国内上线很长一段时间,同时选择了6月20日正式上线年,虽然有帝国时代和红警这样的SLG头部IP,可能会有非常不错的亮眼成绩,但线,做出长LT爆款,levelInfinite还在探索中。
快科技8月9日消息,中国移动公告,2024年上半年,公司营业收入为5467亿元,同比增长3.0%。归属于母公司股东的净利润为802亿元,同比增长5.3%。中国移动也表示,公司决定2024年中期派息每股2.60港元,同比增长7.0%,相当于日赚4.4亿元。截至2024年6月底,中国移动资产总额为19863亿元,负债总额为6377亿元,公司资产负债率为32.1%。公告中还显示,上半年,中国移动个人市场收入达�
一厨电网店员工发帖称,因为优惠条件设置失误,一夜之间被消费者以低价下单四千多单。涉事网店老板表示,粗略统计实际货物价值约两个亿,由于无法发货,部分消费者要求退款30%或退一赔三,无奈之下只能关店。电商平台要补上技术漏洞,定价审核、交易监督、用户信用纪录等方面值得投入更多精力,为消费者和商家营造更加公平的交易环境。
快科技7月15日消息,据灯塔专业版,截至14日22时44分,影片《抓娃娃》点映单日票房突破2亿!这也是今年继春节档《热辣滚烫》2月17日之后时隔147天再次有电影单日票房突破2亿。据灯塔专业版数据,截至14日19时52分,周日票房达3.10亿,超过周六票房,实现大盘单日票房逆跌!电影《抓娃娃》《默杀》《神偷奶爸4》位列单日票房前三位。影片《抓娃娃》点映两天,已连续两天取得单日票房冠军,并于14日获得营销之王”:全网新增想看数、微博新增热搜榜话题数、抖音新增话题播放量、小红书新增话题浏览量均位于暑期档TOP1!据了解,《抓娃娃》是
小米将会推出一款搭载4.X倍2亿长焦镜头的手机,从目前的各种信息推断,这款手机极有可能就是小米15Ultra。除了这颗令人瞩目的4.X倍2亿长焦镜头,小米15Ultra还将配备四摄镜头系统,并且额外拥有一颗小长焦镜头,真正实现了影像方面的全方位覆盖,让用户在各种拍摄场景下都能不留遗憾。让我们共同期待这款新一代影像旗舰的正式发布,它或许会给我们带来更多意想不到的创新和突破。
在今天回顾过去一年AI应用层的进展,AI搜索一定是难以忽视的一个方向。在很长的一段时间里,AI搜索=Perplexity,在榜单上,几乎感受不到其他搜索产品的存在。这个原因可能是,目前市场上用户数量较多的AI产品,比如字节的豆包、百度的文新一言、昆仑万维的天工等产品都包含了AI搜索功能,其他小公司靠做AI搜索似乎确实比较难拿到融资。
快科技8月8日消息,今天中国移动发布了其2024年上半年财报,报告期内实现营收5467亿元人民币,同比增长3.0%。其中,通信服务收入达到4636亿元,同比增长2.5%,数字化转型收入表现尤为强劲,达到1471亿元,同比增长11%,占通信服务收入比提升至31.7%。在盈利能力方面,中国移动上半年净利润达到802亿元,同比增长5.3%,相当于每天4.4亿元。上半年资本开支为640亿元,自由现金流
在一年以前,应该没什么人想到小游戏会成为中国厂商出海的一大利器。中国手游出海出现过几次浪潮。但可以肯定的是,随着越来越多头部小游戏涌向海外,不久的未来应该会有更多的黑马诞生。
“做不出游戏没关系,你们可千万别改变”在游戏行业,向来只有玩家催着厂商快马加鞭搞新作,极少会有玩家反过来宽慰厂商慢慢来,不着急的。尤其是这种倒反天罡的情况出现在该厂砍掉大量好评度颇高的内测产品,六年都憋不出一个新作的大背景之下。至于变天过后,整个游戏行业会迎来怎样的洗盘?我们尚不可知,但对于玩家来说,只要游戏能变得不花钱也好玩,这显然是个值得期待的光明未来。
Clips to Videos 是一款利用人工智能技术,帮助用户将产品片段快速转化为营销视频的工具。它通过简化视频制作流程,让用户能够专注于有效展示产品。产品的主要优点包括AI生成的视频配音、产品卖点辅助、一键生成营销视频、AI生成视频以及自动视频字幕功能,这些功能共同优化了时间和资源的使用。
Overlap是一款AI驱动的播客助手,能够根据用户提出的话题或人物,提供定制化的播客播放列表。它代表了一种创新的播客收听方式,通过人工智能技术,为用户筛选出与其兴趣相关的播客片段,使播客体验更加个性化和便捷。
微博AI嘴替是一款基于微博平台的AI服务,能够分析用户的微博内容,从而推测出用户的性格特征。这项技术结合了自然语言处理和机器学习,通过分析用户的语言风格、话题偏好等信息,为用户提供个性化的性格分析报告。AI嘴替的主要优点在于其新颖性、趣味性以及对用户性格的深入洞察。
Genie是一款AI软件工程模型,它在SWE-Bench行业标准基准测试中取得了30%的评估分数,远超其他同类产品。Genie能够独立或与用户协作解决bug、构建功能、重构代码,就像与同事合作一样。它通过与GitHub问题跟踪器的直接集成,简化了工作流程,确保完全理解特定任务和目标。
Bailing-TTS是由Giant Network的AI Lab开发的大型文本到语音(TTS)模型系列,专注于生成高质量的中文方言语音。该模型采用持续的半监督学习和特定的Transformer架构,通过多阶段训练过程,有效对齐文本和语音标记,实现中文方言的高质量语音合成。Bailing-TTS在实验中展现出接近人类自然表达的语音合成效果,对于方言语音合成领域具有重要意义。
Recap是Fabric平台下的一个功能,它通过AI技术为用户提供个性化的摘要服务,帮助用户定期回顾和吸收他们所保存的阅读材料。Recap能够将用户在不同平台上保存的内容,如文章、笔记等,通过邮件形式发送给用户,并且提供AI生成的摘要,使用户能够在合适的时间高效地回顾和学习。
Docamine是一个利用人工智能技术帮助用户填写文档的在线服务。它通过上传PDF文档或图片,AI自动识别并创建可编辑字段,用户可以编辑和审核这些字段,同时补充缺失信息,添加参考资料,自动填充或更新表单。此外,用户还可以签名并下载填写完毕的PDF文档。Docamine的主要优点包括提高文档处理效率,减少手动输入的时间,以及随着使用时间的增长,AI的学习能力会提升,提供更准确的结果。目前,Docamine提供免费注册和使用。
Falcon Mamba是由阿布扎比技术创新研究所(TII)发布的首个无需注意力机制的7B大规模模型。该模型在处理大型序列时,不受序列长度增加导致的计算和存储成本增加的限制,同时保持了与现有最先进模型相当的性能。
Get笔记是一款集成了人工智能技术的笔记工具,旨在帮助用户实现高效的信息记录和深入的思考。它不仅支持传统的文字输入,还创新性地推出了AI智能输入、速记模式、专注模式等多种功能,以适应不同用户的需求。
Snapbox是一款集成了Ollama AI技术的应用程序,允许用户通过自定义快捷键快速访问AI服务,进行文本分析和反应。它支持本地AI体验,无需联网即可享受快速的AI服务,同时用户可以自定义提示和利用预设模板进行专业AI交互。
Fillout Workflows是一个在线表单自动化工具,它通过内置的表单和调度工作流程帮助用户将表单转化为强大的自动化流程,从而节省团队时间。产品支持个性化电子邮件发送、事件提醒、Slack消息提醒、表单放弃后的跟进等功能,并通过AI技术进行分类和路由,以确保用户能够及时收到最重要的提交信息。
CraftUI是一个在线UI设计工具,允许用户通过文本提示和图像快速生成美观的界面。它拥有超过5100个组件和2400多名用户,服务覆盖20多个国家。用户可以选择不同的样式框架如Tailwind、Bootstrap等,以及多种预设风格,如Material Design、Minimalist等,以满足不同设计需求。
Langtrace是一个开源的可观测性工具,用于收集和分析追踪和指标,帮助提升大型语言模型(LLM)应用的性能。它支持OpenTelemetry标准追踪,可自我托管,避免供应商锁定。Langtrace提供端到端的可观测性,帮助用户全面了解整个机器学习流程,包括RAG或微调模型。此外,Langtrace还支持建立反馈循环,通过追踪的LLM交互创建黄金数据集,不断测试和增强AI应用。
Dream Machine AI是一个利用尖端技术将文字和图片转化为高质量视频的AI平台。它由Luma AI驱动,使用先进的变换模型快速生成具有复杂时空运动的物理准确和一致的视频内容。主要优点包括生成速度快、运动逼真连贯、角色一致性高、相机运动自然。产品定位为视频创作者和内容制作者提供快速高效的视频生成解决方案。
Url to Text Converter是一个利用人工智能技术,从网页中提取主要相关内容并转换为文本的在线工具。它通过AI技术识别并提取网页上的核心信息,支持JavaScript渲染,使用住宅IP地址以帮助绕过某些限制,从而提供更准确和全面的内容提取服务。
Landing Pro AI是一个专注于为代理商、网页设计师和企业家提供快速生成销售型网站文案的服务。它通过使用市场上最好的文案框架,经过无数次实战检验,训练而成。用户可以在短时间内生成整个着陆页的文案,比雇佣自由职业者便宜200倍,且无需等待,可以立即将文案以.PNG和.DOC格式导出,加快实施速度,从而更快地赚钱。
LLaVA-OneVision是一款由字节跳动公司与多所大学合作开发的多模态大型模型(LMMs),它在单图像、多图像和视频场景中推动了开放大型多模态模型的性能边界。该模型的设计允许在不同模态/场景之间进行强大的迁移学习,展现出新的综合能力,特别是在视频理解和跨场景能力方面,通过图像到视频的任务转换进行了演示。
gmft是一个用于将PDF中的表格转换为多种格式的工具包。它轻量级、模块化且性能优越。gmft依赖于微软的Table Transformers,这是众多替代方案中性能最好、最可靠的。gmft无需GPU即可运行,具有高吞吐量,并且安装简便,仅需一行代码即可完成安装。它使用PyPDFium2,因其高吞吐量和宽松的许可证而受到青睐。gmft使用的训练模型TATR在多样化的数据集PubTables-1M上训练,具有高可靠性。
agent-service-toolkit是一个用于运行基于LangGraph的AI代理服务的完整工具包,包括LangGraph代理、FastAPI服务、客户端以及Streamlit应用程序,提供了从代理定义到用户界面的完整设置。它利用了LangGraph框架的高度控制能力和丰富的生态系统,支持并发执行、图循环、流式结果等高级功能。
Bark是由Suno开发的基于Transformer的文本到音频模型,能够生成逼真的多语言语音以及其他类型的音频,如音乐、背景噪声和简单音效。它还支持生成非语言交流,例如笑声、叹息和哭泣声。Bark支持研究社区,提供预训练模型检查点,适用于推理并可用于商业用途。