手把手AI实战(四)让图片开口说话

news/2024/7/7 14:27:28/文章来源:https://blog.csdn.net/djstavaV/article/details/139946216

一、成果展示

1.1 原始图片

1836e4480feb26a778317cc0465796ff.jpeg

1.2 合成的视频

二、步骤拆解

提供一张带完整人脸的图片,系统能够根据音频(或者根据输入文本生成音频)合成视频,也就是AI数字人。

本篇实战使用的AI平台是hedra,网址是:https://www.hedra.com/。目前这个系统还是beta阶段,使用完全免费,而且对于已有的功能,也完全没有任何的使用限制。对于一般的AI数字人产品,它的整体效果还是非常不错的,不仅能够比较好的对口型,人物也更加自然,眨眼、摇头、皱眉都不在话下。

打开网站后,点击右上角的 Sign In 进行登录

50c8a5961620f269958a59cd22b16137.png

这里使用Google账号,点击 Continue with Google

d13b4caaf1267f86aeea0e6a2e646e5c.png

创建Hedra账户,勾选全部服务条款,点击 Create Account

f1a0b8bbff6e705af3ce090d9313c992.png

登录成功后,点击 Try beta

94b0ab09e6739a29e93613adad9ffe68.png

来到操作界面,Audio 部分,这里可以直接输入文本来让系统生成对应的音频

57c3c2e343956433491dd4e129399ca2.png

声音部分系统默认提供了6种,可以自由选择

08c3d280a90c3b64646693d6e22b2ef8.png

如果已经有了对应的音频,可以直接上传,点击 import audio

c559a291b815e2b2af38beb3756cf00c.png

Charactor部分,就是我们视频的主角了,这里可以从本地上传,也可以输入文字提示词进行在线生成

96044a7f7fe6fce824a596496a42fd85.png

OK,到这里,准备工作就已经完成了,最后,点击 Generate video 生成视频,满意的话,可以下载下来保存。

由于系统默认会在视频的右下角留下Hedra水印,在上传到各大视频平台之前,需要先处理一下水印,给大家推荐一款免费的在线去水印工具,https://online-video-cutter.com/cn。

登录后,菜单栏上选择 视频工具 --> 从视频中删除徽标

515a568d60522e7464e282e5a8f50e38.png

打开文件

e788de8905090b6950e656fed8685027.png

文件上传后,就自动进入编辑界面,整体跟视频剪辑软件非常类似。

be5eb1af1a08829014a151f66bc710b9.png

我们将光标移动到水印位置,在水印文字上方框出来,然后点击左侧的应用按钮。

4c36c11a96b03a94a1bfbad135085458.png

完成后,可以播放下视频,看看水印去除后的效果,满意就可以点击保存按钮

b7f606fbede8611e3b175ceb66e4135e.png

免费用户最高可以导出720x720的视频

36c02c768ac56ac96331f6fb66a8f8f5.png

使用过程发现,Hedra对于中文的支持不是很好,目前系统还在beta测试阶段,希望经过几轮的迭代,模型能够越来越好。

三、更多AI实战

想要学习更多AI+自媒体实战的同学,可以扫描下面的二维码,备注AI实战,进实战群,这里每周都有最新的AI实战项目,让我们一起AI,一起技术变现。

8901260da673a6302d6c50192c1facc4.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_1092813.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

监督学习(二)线性分类

每个样本都有标签的机器学习称为监督学习。根据标签数值类型的不同,监督学习又可以分为回归问题和分类问题。分类和回归是监督学习的核心问题。 回归(regression)问题中的标签是连续值。分类(classification)问题中的标签是离散值。分类问题根据其类别数量又可分为…

代码随想录算法训练营第四十一天| 416. 分割等和子集

416. 分割等和子集 - 力扣&#xff08;LeetCode&#xff09; class Solution {public boolean canPartition(int[] nums) {int sum 0;for (int i0;i<nums.length;i){sum nums[i];}if(sum%2!0){return false;}int weight sum /2;// int[][] dp new int[nums.length][weig…

越复杂的CoT越有效吗?Complexity-Based Prompting for Multi-step Reasoning

Complexity-Based Prompting for Multi-step Reasoning 论文&#xff1a;https://openreview.net/pdf?idyf1icZHC-l9 Github&#xff1a;https://github.com/FranxYao/chain-of-thought-hub 发表位置&#xff1a;ICLR 2023 Complexity-Based Prompting for Multi-step Reason…

【Matlab】CNN-LSTM分类 卷积神经网络-长短期记忆神经网络组合模型(附代码)

资源下载&#xff1a; https://download.csdn.net/download/vvoennvv/89466499 分类算法资源合集&#xff1a;https://download.csdn.net/download/vvoennvv/89466519 目录 Matlab SVM支持向量机分类算法 Matlab RF随机森林分类算法 Matlab RBF径向基神经网络分类算法 Ma…

韩顺平0基础学java——第28天

p569-591 坦克大战&#xff01;&#xff08;绘图监听事件线程文件处理&#xff09; 绘图 绘图原理 Component类提供了两个和绘图相关最重要的方法: 1. paint(Graphics g)绘制组件的外观 2. repaint()刷新组件的外观。 当组件第一次在屏幕显示的时候,程序会自动的调用paint()…

通过 Setapp 使用 240 多款 Mac 生产力工具以及 GPT-4o

Setapp 是一项革命性的订阅服务&#xff0c;可以使用 240 多款 Mac 应用程序的综合套件&#xff0c;并配有强大的人工智能助手。 通过 Setapp 为你的工作效率和生产力增添魔力。 Setapp 官网&#xff1a;访问&#xff08;提供 7 天试用&#xff09; Setapp 的主要功能 AI 助手…

Python爬取中国福彩网彩票数据并以图表形式显示

网页分析 首先打开中国福彩网&#xff0c;点击双色球&#xff0c;选择往期开奖栏目 进入栏目后&#xff0c;选定往期的奖金数目作为我们想要爬取的目标内容 明确目标后&#xff0c;开始寻找数据所在的位置 鼠标右击页面&#xff0c;打开网页源代码&#xff0c;在源代码中搜索…

临时关闭Windows安全中心

在使用WindowsOS是&#xff0c;微软安全中心是我们必不可少的安全防护&#xff0c;但有时我们也会产生想要将其关闭的需求&#xff0c;下面将要介绍如何临时关闭Windows的安全中心 一、打开安全中心、选择“病毒与威胁防护”&#xff0c;点击“管理设置” 之后将其实时保护关闭…

Linux企业实时同步服务---3688字

实时同步服务 正常的互联网公司架构&#xff1a; 内容&#xff1a;每天服务器及服务器上的应用程序等正常使用&#xff08;每天查看&#xff09;比如&#xff1a;邮件&#xff0c;短信&#xff0c;等信息&#xff1b;巡检内容是否正常使用。互联网公司就是底层服务开发、代码运…

C++ (week8):数据库

文章目录 一、数据库简介1.数据库2.MySQL(1)数据库的结构(2)MySQL的三种使用方式(3)命令行(4)Navicat Premium 二、SQL1.SQL (Structured Query Language)&#xff0c;即结构化查询语言2.数据定义语言 DDL (Data Definition Language) &#xff0c;创建、修改、删除数据库、表结…

QT listView的简单使用

本文章实现了添加数据&#xff0c;插入数据及删除和清空。用到了Qmessage做为消息提示。lineEdit用于数据的收入&#xff0c;lable用来显示所选中的数据位置的索引。具体代码如下&#xff1a;

go gin web服务器使用fvbock/endless优雅地重启或停止

gin使用fvbock/endless gin 正常使用注册路由时&#xff1a; package mainimport "github.com/gin-gonic/gin"func main() {r : gin.Default()r.GET("/ping", func(c *gin.Context) {c.JSON(200, gin.H{"message": "pong",})})r.Run()…

Kompas AI自然语言处理能力对比

一、引言 自然语言处理&#xff08;NLP&#xff09;是衡量人工智能&#xff08;AI&#xff09;系统智能程度的重要指标之一。NLP技术的进步使得机器能够理解、解释和生成人类语言&#xff0c;在各个领域中发挥了巨大的作用。本文将对比Kompas AI与其他主要AI产品在NLP方面的表…

【ARMv8/v9 GIC 系列 3 -- GIC 的 类型寄存器 GICD_TYPER】

文章目录 GIC 类型寄存器 GICD_TYPERESPI_Range, 位[31:27]RSS, 位[26]No1N, 位[25]A3V, 位[24]IDBits, 位[23:19]DVIS, 位[18]LPIs, 位[17]MBIS, 位[16]NUM_LPIs, 位[15:11]SecurityExtn, 位[10]NMI, 位[9]ESPI, 位[8]CPUNumber, 位[7:5]ITLinesNumber, 位[4:0]GIC 类型寄存器…

计算机系统基础知识(上)

目录 计算机系统的概述 计算机的硬件 处理器 存储器 总线 接口 外部设备 计算机的软件 操作系统 数据库 文件系统 计算机系统的概述 如图所示计算机系统分为软件和硬件&#xff1a;硬件包括&#xff1a;输入输出设备、存储器&#xff0c;处理器 软件则包括系统软件和…

成都晨持绪科技:2024年抖音网店做起来难吗

随着抖音平台的日益火爆&#xff0c;越来越多的商家和个人开始关注并尝试开设自己的抖音网店。然而&#xff0c;面对激烈的市场竞争和不断变化的平台规则&#xff0c;许多人都在问&#xff1a;2024年抖音网店做起来难吗? 要回答这个问题&#xff0c;我们首先需要了解抖音网店的…

网络安全等级保护测评

网络安全等级保护 《GB17859 计算机信息系统安全保护等级划分准则》 规定计算机信息系统安全保护等级共分五级 《中华人民共和国网络安全法》 “国家实行网络安全等级保护制度。 等级测评 测评机构依据国家网络安全等级保护制度规定&#xff0c;按照有关 管理规范和…

执行shell脚本出现 $‘ \r‘ 符号导致执行失败【解决】

&#x1f468;‍&#x1f393;博主简介 &#x1f3c5;CSDN博客专家   &#x1f3c5;云计算领域优质创作者   &#x1f3c5;华为云开发者社区专家博主   &#x1f3c5;阿里云开发者社区专家博主 &#x1f48a;交流社区&#xff1a;运维交流社区 欢迎大家的加入&#xff01…

Linux-磁盘管理与文件系统

目录 一、磁盘结构 1、磁盘的物理结构 2、磁盘的数据结构 3、磁盘存储容量 4、接口类型 二、磁盘分区 1、磁盘的两种分区方式 1.1、MBR分区 1.2、GPT分区 三、查看硬盘的分区情况 1、Fdisk—查询磁盘设备 2、lsblk—以树形查看磁盘分区 3、blkid—查看磁盘的UUID …

IDEA集成Docker实现快捷部署

本文已收录于专栏 《运维》 目录 背景介绍优势特点操作步骤一、修改Docker配置二、配置Docker插件三、编写Maven插件四、构建Docker镜像五、创建Docker容器 总结提升 背景介绍 在我们手动通过Docker部署项目的时候&#xff0c;都是通过把打包好的jar包放到服务器上并且在服务器…