云服务器内容精选

  • 拍摄规格 推荐的相机拍摄规格清单,如表1所示。 表1 相机拍摄规格 拍摄规格 标准 分辨率和帧率 4K、25fps及以上 光圈 小于F4,避免出现明显的景深。 ISO 100~800,避免ISO过高出现噪点。 白平衡 3500~5500K,全程固定白平衡。 录制格式 H.264或H.265编码。 码率 大于20M。 颜色位深 10bit或8bit。 快门速度 快门速度必须小于等于“1/(帧率 * 2)”。 示例:帧率为60时,快门速度必须小于等于1/120。
  • 相机架设 建议选用与40mm-85mm焦距等效的镜头,避免使用超广角。 在合适的高度,将相机竖置并固定于三脚架上,确保水平。 相机与人物眼神平齐,并对焦于模特面部区域,确保面部清晰不失焦。 若录制模特全身,请确保模特脚底有绿幕空隙。 图1 拍摄示例 建议使用相机竖拍。 模特需处于相机拍摄画框的中间,并与画框保持边距,以确保模特做手势时不会越出画面。 图2 拍摄示例(绿幕完全覆盖) 图3 拍摄示例(确保手势不出画面) 避免拍摄人物时,出现过曝或欠曝的画面。 模特建议距离绿幕背景1.5米以上,避免出现阴影。
  • 录制过程 为了保证数字人的训练效果,请按照MetaStudio提供的流程进行录制,整体录制分为如下两个阶段: 手势静默期:录制人物的初始静默状态,时长约30秒。 模特正视镜头,面带微笑,嘴巴闭合,保持静默。手部从初始位置开始,结合平时说话习惯做3~5个动作,每个动作之间间隔3秒,最后回到初始状态。 自然表达期:录制自然说话的嘴型、动作、状态、神情等,时长约4分30秒。 按照提前准备的文稿逐段演讲,保持自然语速和小幅度动作,头部可自然摆动。 停顿时必须完全闭合嘴唇,手部必须恢复至初始状态。建议拍摄前做下相关练习。
  • 收音说明 MetaStuido会使用视频中的语音,并结合对应的真人口型变化,训练口型驱动效果,训练结果还会经过专家的技术审核。 所以在收音这方面,建议如下: 视频的音画必须同步。 环境需安静无噪声。模特人声需清晰,无其他人声干扰。尽量减少视频底噪。 建议选用小蜜蜂或其他专业麦克风搭配相机进行拍摄,会大幅降低视频底噪和其他环境噪声。但请注意:尽量隐藏麦克风不被拍摄到,否则生成的数字人形象会一直包含麦克风。
  • 常见问题 如果拍摄过程中有人闯入或出现突发声音,如雷声、汽车喇叭声等,要重新拍摄吗? 根据以往的录制经验,小于3秒的短暂闯入声音不会对最终训练效果产生明显影响。您只需保证类似的突发声音越少越好。 如果没有小蜜蜂或其他专业麦克风设备,可以使用相机内置的麦克风录制吗? 大部分相机内置麦克风的声音录制效果也能满足要求。MetaStuido对声音清晰度可以有适度妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被摄模特正在说话时。