南洋才女,德艺双馨,孙燕姿本尊回应AI孙燕姿(基于Sadtalker/Python3.10)

孙燕姿果然不愧是孙燕姿,不愧为南洋理工大学的高材生,近日她在个人官方媒体博客上写了一篇英文版的长文,正式回应现在满城风雨的“AI孙燕姿”现象,流行天后展示了超人一等的智识水平,行文优美,绵恒隽永,对AIGC艺术表现得极其克制,又相当宽容,充满了语言上的古典之美,表现出了“任彼如泰山压顶,我只当清风拂面”的博大胸怀。


(相关资料图)

本次我们利用edge-tts和Sadtalker库让AI孙燕姿朗诵本尊的博文,让流行天后念给你听。

Sadtalker配置

之前我们曾经使用百度开源的PaddleGAN视觉效果模型中一个子模块Wav2lip实现了人物口型与输入的歌词语音同步,但Wav2lip的问题是虚拟人物的动态效果只能局限在嘴唇附近,事实上,音频和不同面部动作之间的连接是不同的,也就是说,虽然嘴唇运动与音频的联系最强,但可以通过不同的头部姿势和眨眼来反作用于音频。

和Wav2lip相比,SadTaker是一种通过隐式3D系数调制的风格化音频驱动Talking头部视频生成的库,一方面,它从音频中生成逼真的运动系数(例如,头部姿势、嘴唇运动和眨眼),并单独学习每个运动以减少不确定性。对于表达,通过从的仅嘴唇运动系数和重建的渲染三维人脸上的感知损失(唇读损失,面部landmark loss)中提取系数,设计了一种新的音频到表达系数网络。

对于程序化的头部姿势,通过学习给定姿势的残差,使用条件VAE来对多样性和逼真的头部运动进行建模。在生成逼真的3DMM系数后,通过一种新颖的3D感知人脸渲染来驱动源图像。并且通过源和驱动的无监督3D关键点生成扭曲场,并扭曲参考图像以生成最终视频。

Sadtalker可以单独配置,也可以作为Stable-Diffusion-Webui的插件而存在,这里推荐使用Stable-Diffusion插件的形式,因为这样Stable-Diffusion和Sadtalker可以共用一套WebUI的界面,更方便将Stable-Diffusion生成的图片做成动态效果。

进入到Stable-Diffusion的项目目录:

cd stable-diffusion-webui

启动服务:

python3.10 webui.py

程序返回:

Python 3.10.11 (tags/v3.10.11:7d4cc5a, Apr  5 2023, 00:38:17) [MSC v.1929 64 bit (AMD64)]  Version: v1.3.0  Commit hash: 20ae71faa8ef035c31aa3a410b707d792c8203a3  Installing requirements  Launching Web UI with arguments: --xformers --opt-sdp-attention --api --lowvram  Loading weights [b4d453442a] from D:\work\stable-diffusion-webui\models\Stable-diffusion\protogenV22Anime_protogenV22.safetensors  load Sadtalker Checkpoints from D:\work\stable-diffusion-webui\extensions\SadTalker\checkpoints  Creating model from config: D:\work\stable-diffusion-webui\configs\v1-inference.yaml  LatentDiffusion: Running in eps-prediction mode  DiffusionWrapper has 859.52 M params.  Running on local URL:  http://127.0.0.1:7860

代表启动成功,随后http://localhost:7860

选择插件(Extensions)选项卡

点击从url安装,输入插件地址:github.com/Winfredy/SadTalker

安装成功后,重启WebUI界面。

接着需要手动下载相关的模型文件:

https://pan.baidu.com/s/1nXuVNd0exUl37ISwWqbFGA?pwd=sadt

随后将模型文件放入项目的stable-diffusion-webui/extensions/SadTalker/checkpoints/目录即可。

接着配置一下模型目录的环境变量:

set SADTALKER_CHECKPOINTS=D:/stable-diffusion-webui/extensions/SadTalker/checkpoints/

至此,SadTalker就配置好了。

edge-tts音频转录

之前的歌曲复刻是通过So-vits库对原歌曲的音色进行替换和预测,也就是说需要原版的歌曲作为基础数据。但目前的场景显然有别于歌曲替换,我们首先需要将文本转换为语音,才能替换音色。

这里使用edge-tts库进行文本转语音操作:

import asyncio    import edge_tts    TEXT = """    As my AI voice takes on a life of its own while I despair over my overhanging stomach and my children"s every damn thing, I can"t help but want to write something about it.    My fans have officially switched sides and accepted that I am indeed 冷门歌手 while my AI persona is the current hot property. I mean really, how do you fight with someone who is putting out new albums in the time span of minutes.    Whether it is ChatGPT or AI or whatever name you want to call it, this "thing" is now capable of mimicking and/or conjuring,  unique and complicated content by processing a gazillion chunks of information while piecing and putting together in a most coherent manner the task being asked at hand. Wait a minute, isn"t that what humans do? The very task that we have always convinced ourselves; that the formation of thought or opinion is not replicable by robots, the very idea that this is beyond their league, is now the looming thing that will threaten thousands of human conjured jobs. Legal, medical, accountancy, and currently, singing a song.     You will protest, well I can tell the difference, there is no emotion or variance in tone/breath or whatever technical jargon you can come up with. Sorry to say, I suspect that this would be a very short term response.    Ironically, in no time at all, no human will be able to rise above that. No human will be able to have access to this amount of information AND make the right calls OR make the right mistakes (ok mayyyybe I"m jumping ahead). This new technology will be able to churn out what exactly EVERYTHING EVERYONE  needs. As indie or as warped or as psychotic as you can get, there"s probably a unique content that could be created just for you. You are not special you are already predictable and also unfortunately malleable.    At this point, I feel like a popcorn eater with the best seat in the theatre. (Sidenote: Quite possibly in this case no tech is able to predict what it"s like to be me, except when this is published then ok it"s free for all). It"s like watching that movie that changed alot of our lives Everything Everywhere All At Once, except in this case, I don"t think it will be the idea of love that will save the day.     In this boundless sea of existence, where anything is possible, where nothing matters, I think it will be purity of thought, that being exactly who you are will be enough.     With this I fare thee well.    """    VOICE = "en-HK-YanNeural"  OUTPUT_FILE = "./test_en1.mp3"      async def _main() -> None:      communicate = edge_tts.Communicate(TEXT, VOICE)      await communicate.save(OUTPUT_FILE)      if __name__ == "__main__":      asyncio.run(_main())

音频使用英文版本的女声:en-HK-YanNeural,关于edge-tts,请移步:口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10),这里不再赘述。

随后再将音频文件的音色替换为AI孙燕姿的音色即可:AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践,复刻《遥远的歌》,原唱晴子(Python3.10)。

本地推理和爆显存问题

准备好生成的图片以及音频文件后,就可以在本地进行推理操作了,访问 localhost:7860

这里输入参数选择full,如此会保留整个图片区域,否则只保留头部部分。

生成效果:

SadTalker会根据音频文件生成对应的口型和表情。

这里需要注意的是,音频文件只支持MP3或者wav。

除此以外,推理过程中Pytorch库可能会报这个错误:

torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 6.00 GiB total capacity; 5.38 GiB already allocated; 0 bytes free; 5.38 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

这就是所谓的"爆显存问题"。

一般情况下,是因为当前GPU的显存不够了所导致的,可以考虑缩小torch分片文件的体积:

set PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:60

如果音频文件实在过大,也可以通过ffmpeg对音频文件切片操作,分多次进行推理:

ffmpeg -ss 00:00:00 -i test_en.wav -to 00:30:00 -c copy test_en_01.wav

藉此,就解决了推理过程中的爆显存问题。

结语

和Wav2Lip相比,SadTalker(Stylized Audio-Driven Talking-head)提供了更加细微的面部运动细节(如眼睛眨动)等等,可谓是细致入微,巨细靡遗,当然随之而来的是模型数量和推理成本以及推理时间的增加,但显然,这些都是值得的。

标签:

邮储银行邵阳分行举行“互联网+不动产抵押登记”便民服务点揭牌仪式|聚看点

邮储银行邵阳分行举行“互联网+不动产抵押登记”便民服务点揭牌仪式

06-07 11:29:59

焦点速递!概念动态|华英农业新增“摘帽”概念

同花顺F10数据显示,2023年6月7日华英农业(002321)新增“摘帽”概念

06-07 09:05:19

我的世界大太刀怎么变成妖刀村正_我的世界大太刀怎么变成妖刀

1、将大太刀附魔就好了,具体步骤如下:先准备下材料,他们分别是铁砧

06-07 08:11:34

环球报道:安德烈·桑索维诺

1、安德烈·桑索维诺AndreaSansovino(1467-1529)意大利建筑师和雕刻

06-07 07:27:55

安德烈·梅斯基塔_每日热议

1、安德烈·梅斯基塔。2、葡萄牙职业足球运动员。文章到此就分享结束,

06-07 06:08:15

质量事故的定义_事故的定义|环球热讯

1、事故(1)原泛指事情,现在指意外的损失或灾祸。2、如:交通事故。3、(

06-07 05:36:11

【天天新要闻】极品飞车17存档位置在哪_极品飞车17存档位置

1、可以直接点击文档来查找。2、可能是系统把文档的位置换到另一个磁盘

06-07 03:59:52

【世界独家】俄别尔哥罗德州继续遭炮击 目前已疏散约250人

此外,别尔哥罗德州警方表示,正在帮助舍别基诺市民疏散到安全地带,已

06-07 01:46:50

每日快看:这种虫子冲上热搜!千万别打,有人差点毁容、失明

话题 我的脸被隐翅虫毁容了 近日冲上热搜引发讨论一名网友分享了因隐翅

06-07 00:38:50

天天即时:教育部重要提醒!-每日动态

明日高考2023年全国高考将于明天开考,日前教育部会同有关部门多次作出

06-06 23:58:31

东海证券:给予佩蒂股份买入评级

东海证券股份有限公司姚星辰近期对佩蒂股份进行研究并发布了研究报告《

06-06 23:07:39

电脑加速方法_怎么关闭硬件加速_天天快报

1、对着桌面空白处单击右键,然后选择“属性”,然后就可以打开桌面属

06-06 22:54:49

当前观点:中国出版社行业市场发展现状2023

面对出版业市场化转型的大趋势,为了增强出版社市场竞争能力,提高出版

06-06 22:05:46

广州市黄埔区校本研修负责人高级研修班成员到访实小青华 焦点热门

初夏已至,万物并秀。2023年5月26日,成都市实验小学青华分校承担了广

06-06 21:43:27

需求低迷 硫酸铵价格下跌(5.29-6.5)-环球短讯

一、价格走势据生意社商品行情分析系统,5月29日国内硫酸铵出厂均价为7

06-06 20:47:59

大学生种下“梦想胶囊”,最终实现梦想

十堰广电讯(全媒体记者 翁红 通讯员 鲍晓宇 郑建超)梦想是永

06-06 19:14:06

余额宝是货币理财吗-余额宝是货币资金吗

本文内容是由小编为大家搜集关于余额宝是货币理财吗,以及余额宝是货币

06-06 18:45:48

药学专业要留在大学有什么要求对身体生哪个就好

1、药学专业要留在大学有什么要求药学专业对电脑配置没有什么要求,只

06-06 18:37:55

比亚迪方程豹首款车型外观及谍照公布

今年5月,比亚迪将旗下汽车研发有限公司的企业名称,变更为深圳市方程

06-06 17:44:28

当前消息!上汽等设立上海汽车芯片工程中心,注册资本超5亿

加速拓展整合便捷全球购物提升消费体验上海2023年6月6日 美通社 --2023

06-06 16:25:28

观点:天孚通信回应“新增两亿美元英伟达订单传言”:商业机密不便披露

天孚通信回应“新增两亿美元英伟达订单传言”:商业机密不便披露【大河

06-06 15:07:39

快讯:陕西星思浪铭网络科技公司直播诱惑购买课程

陕西星思浪铭网络科技公司直播诱惑购买课程投诉直通车是湖南日报、华声

06-06 14:23:25

宁波慈溪市正规的男科医院『评价』-宁波男性医院哪儿比较有名啊

男科医院现在是我们医治男科疾病的好挑选,这是因为男科疾病的呈现不仅

06-06 13:27:14

交通运输部:5月城市轨道交通客运量同比增加11.6亿人次、增长87%

北京商报讯(记者方彬楠冉黎黎)6月6日,交通运输部公众号发布2023年5

06-06 12:35:09

快资讯:又是一年“吃瓜”季!这里的西瓜为啥能“秒光”?

中国农科新闻网是农业科技报社顺应网络时代新媒体发展趋势,在三农领域

06-06 11:52:27

美联储加息预期令韩元下跌_全球快资讯

周二(6月6日)亚盘,美元指数最新价报103 98,开盘价为104 01。经济学

06-06 10:38:49

胡同小院长出美育新空间容

  东城一批老院子、名人旧居、会馆有了新内容  胡同小院长出美育新

06-06 09:57:32

手机、无人机成新农具 点点手指就能浇水施肥

“三夏”时节,关注农业生产。眼下,新疆阿克苏沙雅县的35万亩小麦进入

06-06 08:42:56

今日芒种丨每一滴汗水都不会被辜负,一起把诗词画在中华大地上!

6月6日我们迎来夏季的第三个节气芒种栀子花开麦黄梅熟这是二十四节气中

06-06 08:06:04

gtx750显卡怎么样能玩什么(gtx750显卡怎么样) 全球快资讯

gtx750显卡怎么样能玩什么,gtx750显卡怎么样这个很多人还不知道,现在

06-06 07:16:20

世界滚动:生活倒影_关于生活倒影介绍

生活倒影,关于生活倒影介绍这个很多人还不知道,我们一起来看看!1、《

06-06 06:13:30

当前视讯!阿斯报:皇马有信心用一份3年涨薪合同续约塞巴略斯

据西班牙《阿斯报》报道,皇马希望与西班牙中场塞巴略斯续约,他们准备

06-06 05:10:16

世界热消息:全国全省学雷锋活动示范点和岗位学雷锋标兵公布

近日,第八批全国、第九批全省学雷锋活动示范点和岗位学雷锋标兵名单公

06-06 03:57:35

如何打败盖亚_高手告诉我! 环球通讯

想必现在有很多小伙伴对于如何打败盖亚高手告诉我!方面的知识都比较想

06-06 03:09:46

汽车怠速抖动加油不抖是什么原因造成的(汽车怠速抖动加油不抖是什么原因)

想必现在有很多小伙伴对于汽车怠速抖动加油不抖是什么原因方面的知识都

06-06 02:14:19

肃南县水务局加强供水工程运行管护 为群众饮水安全和粮食安全保驾护航 天天信息

肃南县水务局加强供水工程运行管护为群众饮水安全和粮食安全保驾护航为

06-06 01:13:25

外媒:俄罗斯多家电台遭黑客攻击 伪造普京讲话 天天滚动

参考消息网6月5日报道据法新社、俄罗斯卫星社6月5日报道,克里姆林宫

06-06 00:39:11

焦点快看:迪阿股份回应股价波动:受二级市场影响因素较多

中国网财经6月5日讯(记者刘小菲)近期,有投资者在互动平台问迪阿股份“

06-05 23:29:15

环球信息:美畅股份:股东拟减持公司不超2.5%股份

证券时报e公司讯,美畅股份(300861)6月5日晚间公告,公司持股13 06%的

06-05 22:39:06

国际航协:国际航空客运量已恢复至2019年的90%以上

最新数据显示国际航空客运量已恢复至2019年的90%以上,预计今年将实现9

06-05 22:15:10

身边好医生|芒种养生 养心健脾 健康一夏

01:29芒种节气是二十四节气中的第九个节气,夏季的第三个节气,芒种的

06-05 20:54:01

当前热讯:滴滴等多家机构联合发布《2023数字出行助力零碳交通》报告

在6月5日世界环境日之际,由交通运输部科学研究院、滴滴发展研究院、中

06-05 19:38:13

世界热门:应对考前焦虑,家长如何做好“助攻”?听听专家怎么说

东方网记者刘晓晶报道:高考在即,中考临近,在考生们争分夺秒、全力备

06-05 19:04:02

新款奥迪S8的性能与奥迪的旗舰A8相同

新款奥迪S8的性能与奥迪的旗舰A8相同,配备563马力的4 0升V8,四轮驱动

06-05 18:57:55

大咖云集,共话储能安全!守众安新能源行业安全技术论坛圆满召开

2023年5月25日,由福建省消防协会指导,福建守众安智能科技有限公司主

06-05 17:14:56

世界环境日|美丽中国 绿色龙江|全球百事通

6月5日是“世界环境日”,黑龙江省人民政府新闻办公室举行新闻发布会,

06-05 16:18:53

关注!雄安三县高考相关提示来了_每日热议

雄县今年高考时间为6月7日至9日,共计3天。雄县设高考考点3个,为雄县

06-05 15:56:59

世界新资讯:追觅X20 Pro扫地机器人评测:除了7000Pa吸力 它凭什么成为断层第一

地面清洁,一直是家务中的老大难,尽管市面上有着很多智能地面清洁

06-05 15:29:40

当前滚动:黄山市气象局发布雷电黄色预警【III级/较重】【2023-06-05】

黄山市气象台2023年06月05日08时56分发布雷电黄色预警信号。6小时内屯

06-05 14:21:48

通达股份近期累计预中标2.1亿元项目-聚焦

中国网财经6月5日讯(记者刘小菲)通达股份昨日晚间发布公告称,近日累计

06-05 13:58:37

振芯科技:公司目前生产经营正常,公司2023年半年度经营情况详见公司后续披露的定期报告
【原】爱上你,是命中注定-天天观察
首单“港车北上”车辆完成海关备案
南京市中小学生机器人竞赛火热开赛-环球观速讯
跑步流汗会导致钙流失?!经常跑马需要补钙?应该怎么补?
两名救人的海军战士,原来在部队双双立过功
最美少年事迹材料300字左右 最美少年事迹材料|今日热搜
全国主要公路气象预报(6月4日20时至5日20时)
当前看点!通州湾市监局联合多部门对电动自行车租赁平台公司约谈
田园诗派的代表人有哪些?_田园诗派的开创者是谁 田园诗的代表诗人有哪些
汉中中学"MHV"社团_关于汉中中学"MHV"社团简述 环球报道
如何下载小说_怎么下载小说
西番莲图片功效与作用(西番莲图片)
全球讯息:专访:美国没有资格充当民主人权教师爷——访俄政治学家米尔扎扬
天天要闻:海南:露营渐成周末出游新风尚
纯电紧凑型SUV,全新宝马iX1实车亮相,产品力如何?|要闻速递
今日讯!6月30日前未按时提交年报 企业或被罚款成"老赖"
惠誉:美国信用评级仍将处于负面观察状态-全球关注
暗示离队,洛里:无论对俱乐部或我来说,都是一个时代的终结|每日报道
马尚龙:一个宁波人在宁波
2009年中国人均国民收入_中国2012人均gdp_观天下
塞特兰矮马_为什么雪特兰矮马这么矮
乘势而上促消费-微动态
我国载人登月火箭主力发动机单台试车时长创新纪录-全球简讯
热点!电子档案管理_电子档
云南农业品牌研究中心成立 引领产业提升助力乡村振兴-环球即时看
阿根廷要求美国停止对阿输美出口产品设限_当前观察
全球消息!PS4ps5暗黑破坏神4暗黑4 Xbox主机进不去游戏解决办法
全球短讯!手机支付宝登录步骤_手机支付宝登录
m/s^2和g怎么换算_g s d 速看料
三国中被埋没的名将,镇守边疆15年无人敢惹,预言能力堪比诸葛亮
环球快讯:蛋糕做法烤箱简单做法(蛋糕做法)
股票总市值是什么意思(总市值是什么意思)
世界新消息丨第二届四川省高校志愿服务项目大赛启动,新设一条专项赛道
播报:准备好了吗?一大波熊猫来袭!
燕山生态环境司法保护基地在河北承德揭牌
观速讯丨民生银行u宝证书更新证书标识名_民生银行u宝证书更新
快资讯丨语文五年级上册同步练习全部答案
快报:灵异主播日常见鬼(灵异直播间 鬼姐姐文学网)
很小很小的龙虾怎么做好吃_龙虾怎么做好吃
东莞华尔泰装饰材料有限公司(东莞华尔泰装饰材料有限公司)
三国戏曹操传攻略_曹操传 攻略
重点保护道路行道树!涉及南昌井冈山大道、庐山南大道……-天天精选
桂皮是什么树的皮?
一对一和小班课哪个效果更好 哪个提分更快
宁夏加大农村生活污水治理资金投入_世界微速讯
【环球播资讯】许昌市公路事业发展中心积极做好省道网规划调整工作
樱冢澈去哪里了_樱冢澈
环球热消息:秫怎么读(秣怎么读)
关于高考的祝福语成语_关于高考的祝福语 世界新视野
x 广告
x 广告

Copyright ©  2015-2022 华中纤维网版权所有  备案号:京ICP备12018864号-26   联系邮箱:2 913 236 @qq.com