找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 104|回复: 0

爆火开源 AI 数字人 Duix.Avatar:教你 Docker 本地部署

[复制链接]

1

主题

10

回帖

146

积分

管理员

积分
146
发表于 2025-10-15 00:48:37 | 显示全部楼层 |阅读模式

Duix.Avatar(原名 HeyGem ):

一款由 Duix.com 开发的免费开源 AI 数字人项目,支持本地部署和 API 调用。仅需提交一段 10 秒左右的视频,即可快速完成数字人形象和声音克隆,输入文案或上传音频即可驱动数字人口型,自动生成口播播报视频。

6c9633a89f1fabe6814468934c29c575.png

核心功能:

  • • 精准的形象与声音克隆:仅需提交一段约 10 秒的视频,就能快速完成数字人形象和声音的克隆。
  • • 多驱动方式:输入文案或上传音频即可驱动数字人口型,自动生成口播播报视频。
  • • 全离线操作:无需联网即可使用,有效保护用户隐私。
  • • 高效视频合成:实现数字人视频画面与声音的高度同步,自然流畅的口型匹配。
  • • 多语言支持:脚本支持英语、日语、韩语、中文、法语、德语、**语和西班牙语八种语言。

推荐配置:

  • • CPU:第 13 代英特尔酷睿 i5-13400F
  • • 内存:32G 及以上(必要)
  • • 显卡:rtx-4070

TIP:

目前版本客户端不能修改路径和调用的 API,所以建议客户端和服务器部署在同一台设备上。但是因为我的独显在 NAS 上,客户端又是 Windows 所以折腾起来会比较麻烦,有需要的可以简单参考。

服务端

来到项目地址:https://github.com/duixcom/Duix.Avatar

c477b19e2ad7f7d58104eff8349c6f14.png

点击打开 deploy 目录

940a8d72d95423b108396747dcab7fc7.png

4 个配置模版区别:

# Windows 基础完整版 docker-compose.yml# Windows 50系列显卡专用版 docker-compose-5090.yml# Windows 轻量版 docker-compose-lite.yml# Ubuntu 完整版 docker-compose-linux.yml

根据自己的硬件配置和系统进行选择

6fffc9285c5f5aa2dfd62f705ade0fe2.png

我是 NAS 上部署,所以选 docker-compose-linux.yml

d4c644dcd916f6bdea4072123b23c88f.png

默认不用修改直接部署即可,但是我是调用方式所以路径需要修改(这里可以先部署,后面再来根据实际情况修改)

b9b2b2ddc2106038dd47b754a4871c6c.png

服务端部署成功后,资源占用情况

84b7807e4bc99538e07af1f7f02d6124.png

显卡也是没问题,项目启动的时候能看到调用检测

d4a9d2a8b590e05537e88af1a2682025.png

浏览器中输入 http://NAS的IP:18180 能看到 API 界面

e064cdd2a9e407fb434ab01949532864.png

客户端

来到项目,点击下载打包好的文件

c61750f25104c4d63a9fe70bb10eff84.png

根据系统,下载对应客户端文件

aca333ab5c81e757c2fdcf3b777155c9.png

下载以后,无脑安装即可

4cb6741ec9364a6559afa08ecbc570bc.png

打开就是这个界面,点击快速定制

081a346fd7ea96d6606aca092e7e9c62.png

上传一个 8 秒以上的视频,点击提交定制

cc7fa540e4721a5b410cbd12f9603125.png

扩展

理论上如果服务端和客户端都是一台设备,就可以成功运行的了。但如果服务端和客户端是两台设备情况,由于客户端并不能配置路径和端口,就会报错,下面说一下处理方法。

提示路径问题,没有找到 D 盘的 heygem_data 这个目录

932b05df92f0c19dbf2c077228887804.png

因为我只有一个 C 盘,肯定是找不到的

7154eb584f94b6ca14773f5313b0c66d.png

直接通过 SMB 映射驱动盘为 D 盘,确保一定是 D 盘(如果已经有 D 盘,那就改一下原来驱动盘的盘号)

8a18e748437e97150aafa9bfd3f3ef9c.png

保证 D 盘访问以后,根目录能看到 heygem_data 文件夹(NAS 项目部署的时候灵活映射路径)

c1045de37de2e2cfedf6c73b3df5a633.png

当路径没问题以后,就会提示调用本地的 API 不行,因为地址是 NAS 的所以肯定不行

ccb50e32f34957328167cdb4a9736f24.png

下载 NGINX :https://nginx.org/en/download.html

2120d80cb629ace9a7da3592dc385eb9.png

解压 ZIP 文件,找到 nginx.conf 文件

0f9fe8a8303ee9cc38797881fa920759.png

直接覆盖原来配置,修改目标服务器为你的对应 IP 地址即可

worker_processes  auto;events {    worker_connections  1024;}http {    include       mime.types;    default_type  application/octet-stream;    sendfile        on;    tcp_nopush      on;    keepalive_timeout  65;    # 通用代理头    proxy_set_header Host $host;    proxy_set_header X-Real-IP $remote_addr;    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;    proxy_set_header X-Forwarded-Proto $scheme;    # 服务1    server {        listen 18180;        location / {            proxy_pass http://192.168.31.100:18180;            # WebSocket支持            proxy_http_version 1.1;            proxy_set_header Upgrade $http_upgrade;            proxy_set_header Connection"upgrade";            proxy_read_timeout 3600s;        }    }    # 服务2    server {        listen 10095;        location / {            proxy_pass http://192.168.31.100:10095;            # WebSocket支持            proxy_http_version 1.1;            proxy_set_header Upgrade $http_upgrade;            proxy_set_header Connection"upgrade";            proxy_read_timeout 3600s;        }    }    # 服务3    server {        listen 8383;        location / {            proxy_pass http://192.168.31.100:8383;            # WebSocket支持            proxy_http_version 1.1;            proxy_set_header Upgrade $http_upgrade;            proxy_set_header Connection"upgrade";            proxy_read_timeout 3600s;        }    }}

打开 CMD,来到当前 nginx.exe 的目录,输入:nginx.exe

540a6f6caa51ac2ce445441c76682739.png

客户端中,浏览器中输入 http://127.0.0.1:18180 能看到 API 界面(CMD 窗口不要关了)

02ebbc1e437d29aaf2084d29c357ea8f.png

前面生成的视频没有声音,这里换了另外一个

0acec3e562b21494f57d1bbb8dfe5bc2.png

日志可以看到识别出视频的语音内容

35a445d4cf39617dd2b109f83edc7d89.png

这样数字模特就制作完成了

c6b5b58d768be5660821e1a930cd05dd.png

选择做视频

9ca991c8b6a1184d83ba3aee62ceed72.png

先来测试一下文本合成,输入内容,点击试听

a950948a4d9488cf99f6212d6d7f6c90.png

此时显卡已经在调用了

e730c2698fe0f7fb48e5775d08f90ffd.png

生成语音,和原来视频声音基本一样的

753081ec5c43fa1e935b8e55ac4ea82a.png

音频合成,需要上传一个音频

9efb12a563cd77274059d518379450c3.png

不管是文本,还是音频都行,最后点击合成视频

de785f0842d489c97835f8ce94918ab8.png

提交以后,可以去看制作进度

f36c7043602b6afcb0a80597f0eec695.png

不同性能显卡用时不一样,我用的是 A2000LP 8GB 显卡,

9349bce6f5e10f607c2a168857e6c68e.png

日志可以看到是不断运行的

164d1669239ec99753784239c6c1dea3.png

最后是合成失败了,也不清楚为什么

e4c2df4a73558e5dcf58d450404d9b78.png

总结

Duix.Avatar 作为一款开源免费的 AI 数字人工具,整体表现中规中矩。它的核心优势在于,仅需 10 秒视频就能完成形象与声音的克隆,还支持通过多语言文本或音频驱动数字人口型,且全离线操作可保障隐私,视频合成的同步性也较好。

不过,使用体验中存在的问题不少,尤其是当服务端与客户端不在同一设备时,还需借助 SMB 映射磁盘和 NGINX 代理来解决,这对新手而言有一定门槛。总体来说,该工具对于需要用 AI 数字人制作视频的用户有一定实用价值,闲鱼上也有很多关于本地部署的教程在售卖。

综合推荐:⭐⭐⭐(中规中矩,一般人用不上)

使用体验:⭐⭐⭐(客户端不够灵活,跨设备需额外操作)

部署难易:⭐⭐⭐(一般)

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

本站由纳斯五零(NAS50.CN),版权所有,保留部分权利。豫ICP备2023035803号-1

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2025-10-24 12:44 , Processed in 0.109730 second(s), 27 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表