今天研究下文生图,先用deepseek的 janus
首先访问官方的github
GitHub - deepseek-ai/Janus: Janus-Series: Unified Multimodal Understanding and Generation Models
先git clone 代码下来。
看下面的介绍安装 python 依赖
pip install -e .
这是因为源码中存在了 pyproject.toml 文件所以可以用上面命令安装依赖
但我发现安装非常慢,即便openwrt科学了,所以需要找国内的源
我这里使用清华的
# 临时使用 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple package_name # 永久配置 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
执行后会往Writing to C:\Users\Administrator\AppData\Roaming\pip\pip.ini 这个路径写入文件
但我没找到
如果配置多个源,更改上面的文件
[global] index-url = https://pypi.tuna.tsinghua.edu.cn/simple extra-index-url = https://pypi.douban.com/simple extra-index-url = https://pypi.mirrors.ustc.edu.cn/simple/
二、下载模型
可以从上图链接的Hugging Face 下载,也可以去modescope 下载
三、安装python的虚拟环境
我理解虚拟环境是用来做项目依赖隔离的,避免各个项目包之间冲突,目前有python自带的venv和第三方的conda
这里以conda为例
首先去官网Download Anaconda Distribution | Anaconda
然后输入自己的邮箱地址获取下载链接
安装完后我cmd运行 conda --version 没有
需要添加Path环境变量
列出信息
conda info
创建环境
conda create -n xxxxx python=3.10 -y
列出环境
conda info --envs
激活环境
activate xxxxxx
列出包
conda list
另外一个发现是直接cmd中 conda list貌似用的base环境
如果在新建的环境中点右边的图标
前面会出现环境名
当然直接cmd中也可以用activate xxxx切换环境
切换后再设置一次源
# 永久配置 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
此时去找Writing to C:\Users\fyj\AppData\Roaming\pip\pip.ini 这个文件反而是存在的
接着cd 到janus 的源码目录
再执行
pip install -e .
安装Gradio (UI)
pip install gradio
运行Janus Pro UI
python demo/app_januspro.py
但是我把app_januspro.py 的path 改成下载好的模型路径,发现跑不了
改回来好像还是不行?
调用GPU
python demo/app_januspro.py --device cuda
我这没N卡就不试了
2.24
上面报错是由于没有安装ROCm 这是AMD显卡需要安装的,去amd官网搜索下载,好像最低支持amd rx6xxx 也就是rx6600
顺便还安装了 amd-software-adrenalin-edition
然后就跑起来了
但是发现好像没有调用显卡,而是用cpu在跑,太慢了无法接受,生成一张简单的哈士奇图片已经500多秒没出来了
内存上去了,显存和显卡占用还是空着
ROCm 支持的显卡型号
System requirements (Windows) — HIP SDK installation (Windows)
专业卡型号