可灵 AI 是快手 AI 团队自研的视频生成大模型,于 2024 年 6 月 6 日在官网正式上线,随后经历多次迭代升级,不断优化。它采用类 Sora 的 DiT 结构,以 Transformer 替代传统卷积网络结构,结合 flow 模型作为扩散模型基座,显著提升计算效率。可灵 AI 功能强大,支持文生视频、图生视频、视频续写、运镜控制、首尾帧自定义等多种能力。能够根据文本提示生成长达 2 分钟、帧率 30fps、分辨率 1080p 的高质量视频,并支持多种宽高比。生成的视频运动幅度大且合理,可模拟物理世界特性,具有强大的概念组合能力和想象力。同时,还拥有高表现模式、视频延长等会员专属功能。
支持生成长度最高3分钟的高清视频,分辨率为1080p,帧率为30fps。
生成的视频内容符合运动规律,能够模拟真实世界的物理特性。
具备强大的概念组合能力,能够将用户丰富的想象力转化为具体的画面。
采用3D时空联合注意力机制和Diffusion Transformer架构,实现高质量的视频生成。
支持自由的输出视频宽高比,满足用户不同的创作需求。
基于3D人脸和人体重建技术,实现表情肢体全驱动技术,增强视频的生动性和表现力。
根据用户需求进行个性化定制,生成符合特定风格和主题的视频。
支持多种视频风格和特效,用户可自由选择和调整。
适用于广告与营销、影视制作、教育培训、社交媒体和游戏开发等多个行业,帮助提高视频制作效率和质量。
可以看出可灵大模型在视频生成领域具有显著的技术优势和应用前景,能够为视频创作者和各行业提供强大的支持。
可灵 AI 的使用方法如下:
网页端
注册与登录:访问可灵 AI 官网,完成注册后登录账号。
文生视频
进入页面:点击 “AI 视频”,进入视频生成页面。
输入描述:在 “创意描述” 框内输入不超过 500 字的提示词,比如 “低角度向上推进,缓缓抬头,冰山上突然出现一条恶龙,然后恶龙发现你,冲向你”。
设置参数:拖动 “创意想象力和相关性” 滑块调整视频风格倾向;选择 “高性能” 或 “高表现” 模式;设置 “生成时长”;选择 “视频比例”;设置 “运镜控制和运镜方式”;在 “不希望呈现的内容” 框输入避免出现的问题。
生成视频:确认无误后,点击 “立即生成” 按钮。
查看与下载:生成的视频会保存在右上角的 “所有视频” 中,可在此查看、预览和下载。
图生视频
进入页面:点击 “AI 视频”,进入视频生成页面。
上传图片:点击上传按钮,选择一张图片。
输入描述:在提示词输入框输入文字描述,帮助 AI 更好地理解生成方向。
设置参数:选择 “高性能” 或 “高表现” 模式等参数。
生成视频:确认无误后,点击 “立即生成” 按钮。
查看与下载:与文生视频一样,在 “所有视频” 中查看、预览和下载生成的视频。
手机端
下载与安装:在苹果 App Store 或安卓应用商店搜索 “可灵 AI”,下载安装。
文生视频
进入功能:打开可灵 AI,点击 “AI 视频” 中的文生视频功能。
输入描述:在输入框内输入提示词。
设置参数:设置相关参数,如生成模式等。
生成视频:点击 “立即生成”。
查看与下载:在生成记录或相关文件夹中查看、下载视频。
图生视频
进入功能:点击 “AI 视频” 中的图生视频功能。
上传图片:点击上传按钮,从手机相册中选择图片。
输入描述:输入文本描述。
设置参数:设置相关参数。
生成视频:点击 “立即生成”,等待视频生成完成后查看、下载。
AI 图片生成
新建创作:点击屏幕下方的加号,开始新建创作。
输入描述:输入想要的描述内容,也可选择随机生成。
上传参考图:如有需要,上传 JPG 或 PNG 格式的参考图。
设置比例和数量:设置图片的比例和生成数量。
生成图片:点击 “立即生成” 按钮。
2 个月前
通义千问作为一款备受瞩目的 AI 产品,宛如一位全能助手,在智能对话、创意创作、办公助力、学习辅助以及生活服务等众多领域大显身手。它能像知心好友一样陪你谈天说地,又能化身专业智囊为工作学习排忧解难。但你是否好奇,通义千问这强大的功能背后,究竟支持着哪些语言,来满足全球用户的多样需求呢?接下来,就让我们一探究竟。
2 个月前
在数字化办公飞速发展的当下,高效的写作工具成为职场人士和公务人员的必备 “神器”。讯飞文书,作为科大讯飞基于讯飞星火大模型打造的 AI 智能写作工具,正以其强大的功能和独特的优势,在各类写作场景中崭露头角。那么,这个备受瞩目的工具究竟能为我们做些什么?它的使用又是否需要付费呢?让我们一同深入了解。