嘿格姆 - 硅智开源数字人体模型

Heygem是什么？

Heygem是硅基智能推出的开源数字人模型，专为Windows系统设计。依托先进AI技术，Heygem仅需1秒视频或单张照片即可在30秒内克隆数字人形象与声音，60秒内合成4K超高清视频。支持多语种输出、多表情多动作，实现100%唇形匹配精度，在复杂光照或遮挡场景下仍保持高度真实效果。全程离线运行保障用户隐私，支持低配置硬件部署，大幅降低使用门槛，为内容创作、直播带货、教育培训等领域提供高效经济的数字人解决方案。

核心功能

极速克隆：仅需1秒视频或单张照片即可克隆数字人形象与声音，30秒完成克隆，60秒合成4K超高清视频

高效推理：实现1:0.5的推理速度比和1:2的视频渲染速度

超清画质：支持32帧/秒的4K超高清视频输出，超越好莱坞24帧标准

多语种支持：克隆数字人支持8种语言输出，满足全球市场需求

无限克隆：支持数字人形象与声音的无限克隆，以及视频的无限合成

100%唇形匹配：在复杂光照、遮挡或侧角度场景下仍可实现高度真实的唇形匹配

低硬件要求：支持Docker一键部署，最低可在NVIDIA 1080Ti显卡硬件运行

技术原理

声音克隆技术：基于先进AI生成与样本相似或相同的声音，捕捉语境、语调和语速

自动语音识别(ASR)：将人类语音转换为计算机可读输入，使计算机能"理解"口语

计算机视觉技术：用于视频合成中的视觉处理，包括面部识别和唇形分析，确保虚拟角色口型与音频文本内容匹配

项目仓库

GitHub仓库：https://github.com/GuijiAI/HeyGem.ai

使用指南

安装要求：

系统要求：Windows 10版本19042.1526或更高

推荐配置：

CPU：第13代英特尔酷睿i5-13400F

内存：32GB

显卡：RTX 4070

存储空间：

D盘：用于存储数字人及项目数据，需30GB以上空间

C盘：用于存储服务镜像文件，需100GB以上空间

依赖项：

Node.js 18

Docker镜像：

docker pull guiji2025/fun-asr:1.0.2

docker pull guiji2025/fish-speech-ziming:1.0.39

docker pull guiji2025/heygem.ai:0.0.7_sdk_slim

安装步骤：

安装Docker：检查是否已安装WSL(Windows子系统Linux版)，未安装则运行wsl --install。更新WSL后下载安装Docker for Windows

安装服务端：使用Docker和docker-compose安装服务端，在/deploy目录运行docker-compose up -d

安装客户端：运行npm run build:win生成安装程序HeyGem-1.0.0-setup.exe，双击完成安装

应用场景

内容创作：快速生成动画、教学视频等，降低制作成本

在线教育：创建支持多语言教学的虚拟教师，提升教学趣味性

直播营销：用于虚拟直播带货和产品推介，降低人力成本

影视特效：生成虚拟角色或特效镜头，简化制作流程

AI客服：打造虚拟客服形象，提供自然的人机交互体验

Heygem是什么？

核心功能

极速克隆：仅需1秒视频或单张照片即可克隆数字人形象与声音，30秒完成克隆，60秒合成4K超高清视频

高效推理：实现1:0.5的推理速度比和1:2的视频渲染速度

超清画质：支持32帧/秒的4K超高清视频输出，超越好莱坞24帧标准

多语种支持：克隆数字人支持8种语言输出，满足全球市场需求

无限克隆：支持数字人形象与声音的无限克隆，以及视频的无限合成

100%唇形匹配：在复杂光照、遮挡或侧角度场景下仍可实现高度真实的唇形匹配

低硬件要求：支持Docker一键部署，最低可在NVIDIA 1080Ti显卡硬件运行

技术原理

声音克隆技术：基于先进AI生成与样本相似或相同的声音，捕捉语境、语调和语速

自动语音识别(ASR)：将人类语音转换为计算机可读输入，使计算机能"理解"口语

计算机视觉技术：用于视频合成中的视觉处理，包括面部识别和唇形分析，确保虚拟角色口型与音频文本内容匹配

项目仓库

GitHub仓库：https://github.com/GuijiAI/HeyGem.ai

使用指南

安装要求：

系统要求：Windows 10版本19042.1526或更高

推荐配置：

CPU：第13代英特尔酷睿i5-13400F

内存：32GB

显卡：RTX 4070

存储空间：

D盘：用于存储数字人及项目数据，需30GB以上空间

C盘：用于存储服务镜像文件，需100GB以上空间

依赖项：

Node.js 18

Docker镜像：

docker pull guiji2025/fun-asr:1.0.2

docker pull guiji2025/fish-speech-ziming:1.0.39

docker pull guiji2025/heygem.ai:0.0.7_sdk_slim

安装步骤：

安装Docker：检查是否已安装WSL(Windows子系统Linux版)，未安装则运行wsl --install。更新WSL后下载安装Docker for Windows

安装服务端：使用Docker和docker-compose安装服务端，在/deploy目录运行docker-compose up -d

安装客户端：运行npm run build:win生成安装程序HeyGem-1.0.0-setup.exe，双击完成安装

应用场景

内容创作：快速生成动画、教学视频等，降低制作成本

在线教育：创建支持多语言教学的虚拟教师，提升教学趣味性

直播营销：用于虚拟直播带货和产品推介，降低人力成本

影视特效：生成虚拟角色或特效镜头，简化制作流程

AI客服：打造虚拟客服形象，提供自然的人机交互体验

嘿格姆 - 硅智开源数字人体模型

Heygem是什么？

核心功能

技术原理

项目仓库

使用指南

应用场景

摘要

嘿格姆 - 硅智开源数字人体模型

Heygem是什么？

核心功能

技术原理

项目仓库

使用指南

应用场景

摘要