会员登录 立即注册

搜索

剪映数字人口播原理

[复制链接]
崎山小鹿 发表于 2024-7-3 21:22:34 | 显示全部楼层 |阅读模式
崎山小鹿
2024-7-3 21:22:34 1795 2 看全部
剪映版本升级了,新版本6.0.1支持数字人定制,于是我赶紧申请了使用资格
微信截图_20240702200113.png

目前的价格是49元创建一个数字人形象,能使用30天,30天之后要重新续费。
微信截图_20240703210617.png

支付49元之后剪映要求上传2.5至10分钟的视频
微信截图_20240703093744.png

接着要阅读一段话并录制视频上传
微信截图_20240703125157.png

第三步提交
微信截图_20240704115252.png

提交完成之后大概一个小时就会有一个特定数字人形象出现:
微信截图_20240703211258.png

发现在使用这个数字人时还额外的需要消耗积分,而我的积分为0,需要注册会员获取积分,就购买了一个19元包月的会员,终于可以正常使用了。

因为第一次定制数字人踩了不少坑。

1.上传的视频中每一帧都要有人物画面,像人物入场或者起身离场的画面都不能有。如果有这样的画面要用视频编辑软件剪掉。

2.录视频时眼睛平视摄像头,你以为他会自动纠正你的眼睛,滚犊子。

3.尽量露出完整的上半身轮廓,不要出现缺胳膊的情况。

4.嘴巴在任何时候都不能遮挡,如果要手扶眼镜要避开手拂过嘴巴的情况。
微信截图_20240703213558.png


推测剪映数字人的原理是:得到你的视频素材之后提取你的嘴型与音频的对应关系,在生成数字人的时候重新播放你的原始素材再根据当前的语音音频提取对应的嘴型,将新的嘴型覆盖原始素材嘴型,即完成数字人口播视频的生成。那么这里用到了嘴型识别技术和换嘴技术。相比3D数字人嘴型驱动方式这种对服务器的压力小太多,使用的嘴型都是原始素材中直接提取,所以生成的画面也非常逼真。

下面是我花了68元做的数字人效果。

天不生墨翟,万古如长夜!加我微信:qishanxiaolu
想制作数字人或直播平台的请和我们联系,微信:qishanxiaolu   电话:15876572365   公司:深圳市金双石科技有限公司
回复

使用道具 举报

 楼主| 崎山小鹿 发表于 2024-7-3 22:39:12 | 显示全部楼层
崎山小鹿
2024-7-3 22:39:12 看全部
即使是字节跳动这样的公司做产品也是非常谨慎和保守的,以最少的投入获取最大的回报,能把数字人定制打到两位数以下也没别人了。
天不生墨翟,万古如长夜!加我微信:qishanxiaolu
想制作数字人或直播平台的请和我们联系,微信:qishanxiaolu   电话:15876572365   公司:深圳市金双石科技有限公司
回复

使用道具 举报

 楼主| 崎山小鹿 发表于 2024-7-3 22:41:48 | 显示全部楼层
崎山小鹿
2024-7-3 22:41:48 看全部
崎山小鹿 发表于 2024-7-3 22:39
即使是字节跳动这样的公司做产品也是非常谨慎和保守的,以最少的投入获取最大的回报,能把数字人定制打到两 ...

换脸技术都比字节数字人技术高一个等级,更别说3d数字人嘴型和表情驱动了。
天不生墨翟,万古如长夜!加我微信:qishanxiaolu
想制作数字人或直播平台的请和我们联系,微信:qishanxiaolu   电话:15876572365   公司:深圳市金双石科技有限公司
回复

使用道具 举报

  • 您可能感兴趣
  • 根据语音生成视频33搜帧
    根据语音生成视频33搜帧
    33搜帧,是一个能根据语音生成视频的网站, https://fse.agilestudio.cn/ 33搜帧是一
    10-18
  • 无人机拍摄卖素材
    无人机拍摄卖素材
    使用无人机拍摄各大城市的地标建筑,不同季节、不同时间下的美景,然后挂到光厂上卖。
    10-17
  • 利用闲置宽带提供CDN服务赚钱
    利用闲置宽带提供CDN服务赚钱
    内容分发网络CDN,阿里云CDN每G数据成本在0.24元,idc收入1G 8万 每年,家宽1G 大几百
    10-16
  • 定制激光雕刻
    定制激光雕刻
    几乎支持任何材质的雕刻 啄木鸟4代激光雕刻机 木质用蓝光雕刻 石板用红光雕刻 金属用
    10-16
  • 在线字数统计
    在线字数统计
    https://www.eteste.com/ 能将一段文字统计出文字数量以及标点符号的数量
    10-16
您需要登录后才可以回帖 登录 | 立即注册 |

本版积分规则 返回列表

管理员给TA私信
加我微信:qishanxiaolu

查看:1795 | 回复:2

  • 根据语音生成视频33搜帧

    33搜帧,是一个能根据语音生成视频的网站, https://fse.agilestudio.cn/ 33搜帧是一

    阅读:42|2024-10-18
  • 无人机拍摄卖素材

    使用无人机拍摄各大城市的地标建筑,不同季节、不同时间下的美景,然后挂到光厂上卖。

    阅读:55|2024-10-17
  • 利用闲置宽带提供CDN服务赚钱

    内容分发网络CDN,阿里云CDN每G数据成本在0.24元,idc收入1G 8万 每年,家宽1G 大几百

    阅读:105|2024-10-16
  • 定制激光雕刻

    几乎支持任何材质的雕刻 啄木鸟4代激光雕刻机 木质用蓝光雕刻 石板用红光雕刻 金属用

    阅读:87|2024-10-16
  • 在线字数统计

    https://www.eteste.com/ 能将一段文字统计出文字数量以及标点符号的数量

    阅读:113|2024-10-16
  • 训练自己的语音并生成音频fish.audio

    Fish Speech 是一个致力于提供高质量、易用且功能强大的语音合成解决方案的开源项目。

    阅读:306|2024-10-12
  • 文字和图片生成3D模型meshy

    不仅可以0基础建模,还能让模型做各种动作。 https://www.meshy.ai/discover 支持

    阅读:312|2024-10-11
  • 3D数字人做得不错的企业

    魔法科技3D数字人 https://www.xmov.ai/application?from=baidumfsenariokw2675/pc&bd

    阅读:441|2024-10-10
  • 风险系数和(投入金额、交易次数)成正比

    风险系数 = 金额 * 交易次数*风险常数 1000万交易1次的风险和100万交易10次风险是一

    阅读:322|2024-10-10
  • 白桦木实木弹弓

    白桦木实木弹弓 适用年龄:3岁以上 售价:15元两只(买一送一) 非常耐用,简单实

    阅读:493|2024-10-08
金双石科技,软件开发20年,技术行业领先,您的满意,就是我们的目标,认真负责,开拓进取,让成品物超所值
关于我们
公司简介
发展历程
联系我们
本站站务
友情链接
新手指南
内容审核
商家合作
广告合作
商家入驻
新闻合作

手机APP

官方微博

官方微信

联系电话:15876572365 地址:深圳市宝安区西乡街道宝民二路宝民花园 ( 粤ICP备2021100124号-1 ) 邮箱:qishanxiaolu@qq.com
QQ|Powered by Discuz! X3.5 © 2001-2024 Discuz! Team.
快速回复 返回顶部 返回列表