AI人工智能:改变普通人生活和商业化的几种应用场景

NO.1
AI常用场景

适合个人的,在网络上出现和讨论最多的有

  1. ​ChatGpt(人工智能聊天机器人程序)(可以自动生成文本,自动问答,自动摘要等多种任务)(写毕业论文,会议报告,代码提示,小说框架等等)

  2. Midjourney 和 Stable Diffusion(AI绘画)(UI,平面设计)

适合商家或者企业的,从功能上主要有以下几种

  1. 智能客服(AI)(如x宝千牛智能客服)(x0086电话客服)

  2. 虚拟数字人(AI)(如x音直播,x宝直播,二次元vtuber)(直播带货

  3. 企业知识库(AI)(适合有一定规模的企业)

  4. 商品详情(AI)Midjourney 和 Stable Diffusion和Photoshop(一件换衣等)

还有一些其他音视图文领域

  1. TTS文本转语音(微软AI语音合成-Azure)

  2. AI变声(男转女,女转男,特定声音如派蒙,以及语音真人模拟)

  3. 人脸动漫化,图片超清,图片上色,OCR识别,图片修复,智能抠图

  4. 动漫超分,去水印,字幕生成等

img

NO.2
AI工具使用

参考下列表格,整理自AI工具箱

文本
音频
图片
视频
ChatGpt
语音降噪
智能抠图
动漫超分
AI绘画
静音消除
照片放大
动漫超分RealCugan
派蒙语音Bert
AI音乐生成
人脸动漫化AnimeGANv2 真人自然超分
派蒙语音合成
字幕生成
动漫放大RealCugan 补帧
VITS语音合成
AI变声器
动漫放大RealESRGAN 一件超补
微软语音Azure
音乐背景分离
图片OCR识别Paddle-OCR-v3 去水印
微软语音Edge
图片上色
人像抠图
微软语音合成
人脸融合FaceFusion 目标检测
火山语音合成
照片转动漫
视频字幕生成
文字转说唱Rap
图片修复
视频硬字幕OCR提取
文字转歌曲
超级慢动作
字幕翻译
图片转视频
视频动漫化
视频修复
视频换脸

img

NO.3
AI商业场景

参考各种AI SDK

如AI开放平台,看看提供哪些API,每个API的使用场景,以及API的价格

价格越高,壁垒越高,效果越高,能放上去的类目大多是有市场或者销售预期

列举一些类目

语音技术,文字识别,人脸与人体,图像技术,语言与知识,视频技术,AR与VR,数据智能等

一些普通人用不上但是应用业务会用上的内容

身份证识别,银行卡识别,营业执照识别,车牌识别,发票识别

一些用于提供给用户的好玩,有趣的功能

人像动漫化(类似x宝上的手绘头像服务)

黑白图片上色(类似x宝上的老照片上色服务)

img

img

NO.4
Tips

目前最火热的是AI大模型

各种AI应用层出不穷,相应的费用也高

本文对于AI的需求有以下几点

  1. 可以私有化部署(隐私安全,免费优先)

  2. 可以进行模型微调或者训练(个性化需求,非大众化功能)

  3. 算力不高的设备也尽可能适用(如嵌入式设备,家用电脑等,非企业级算力)

img

END.

觉得本文还行,不妨顺手点赞收藏,下期见。

推荐阅读

AI人工智能:开源PaddleOCR(OCR图像识别)

HomeLab迷你小主机(x86):Docker部署开源跨平台ChatGPT应用Next-Web

Bing Chat的使用方法和使用体验

☕ 朋友,都看到这了,确定不关注一下么? 👇