适合个人的,在网络上出现和讨论最多的有
-
ChatGpt(人工智能聊天机器人程序)(可以自动生成文本,自动问答,自动摘要等多种任务)(写毕业论文,会议报告,代码提示,小说框架等等)
-
Midjourney 和 Stable Diffusion(AI绘画)(UI,平面设计)
适合商家或者企业的,从功能上主要有以下几种
-
智能客服(AI)(如x宝千牛智能客服)(x0086电话客服)
-
虚拟数字人(AI)(如x音直播,x宝直播,二次元vtuber)(直播带货)
-
企业知识库(AI)(适合有一定规模的企业)
-
商品详情(AI)Midjourney 和 Stable Diffusion和Photoshop(一件换衣等)
还有一些其他音视图文领域
-
TTS文本转语音(微软AI语音合成-Azure)
-
AI变声(男转女,女转男,特定声音如派蒙,以及语音真人模拟)
-
人脸动漫化,图片超清,图片上色,OCR识别,图片修复,智能抠图
-
动漫超分,去水印,字幕生成等
参考下列表格,整理自AI工具箱
文本 |
音频 |
图片 |
视频 |
ChatGpt |
语音降噪 |
智能抠图 |
动漫超分 |
AI绘画 |
静音消除 |
照片放大 |
动漫超分RealCugan |
派蒙语音Bert |
AI音乐生成 |
人脸动漫化AnimeGANv2 | 真人自然超分 |
派蒙语音合成 |
字幕生成 |
动漫放大RealCugan | 补帧 |
VITS语音合成 |
AI变声器 |
动漫放大RealESRGAN | 一件超补 |
微软语音Azure |
音乐背景分离 |
图片OCR识别Paddle-OCR-v3 | 去水印 |
微软语音Edge |
图片上色 |
人像抠图 |
|
微软语音合成 |
人脸融合FaceFusion | 目标检测 |
|
火山语音合成 |
照片转动漫 |
视频字幕生成 |
|
文字转说唱Rap |
图片修复 |
视频硬字幕OCR提取 |
|
文字转歌曲 |
超级慢动作 |
||
字幕翻译 |
图片转视频 |
||
视频动漫化 |
|||
视频修复 |
|||
视频换脸 |
参考各种AI SDK
如AI开放平台,看看提供哪些API,每个API的使用场景,以及API的价格
价格越高,壁垒越高,效果越高,能放上去的类目大多是有市场或者销售预期
列举一些类目
语音技术,文字识别,人脸与人体,图像技术,语言与知识,视频技术,AR与VR,数据智能等
一些普通人用不上但是应用业务会用上的内容
身份证识别,银行卡识别,营业执照识别,车牌识别,发票识别
一些用于提供给用户的好玩,有趣的功能
人像动漫化(类似x宝上的手绘头像服务)
黑白图片上色(类似x宝上的老照片上色服务)
目前最火热的是AI大模型
各种AI应用层出不穷,相应的费用也高
本文对于AI的需求有以下几点
-
可以私有化部署(隐私安全,免费优先)
-
可以进行模型微调或者训练(个性化需求,非大众化功能)
-
算力不高的设备也尽可能适用(如嵌入式设备,家用电脑等,非企业级算力)
END.
觉得本文还行,不妨顺手点赞和收藏,下期见。
推荐阅读
《HomeLab迷你小主机(x86):Docker部署开源跨平台ChatGPT应用Next-Web》
☕ 朋友,都看到这了,确定不关注一下么? 👇