服务器部署开源大模型完整教程 Ollama+Gemma+open-webui

news/2024/12/13 14:34:54

现在开源的大模型其实挺多的,今天搭建Gemma这个谷歌开源的大模型,但是你想搭建别的只要你看完你都会了。

介绍

Ollama:一款可以让你在本地快速搭建大模型的工具

官网:https://ollama.com/

github:https://github.com/ollama/ollama

Gemma:谷歌开源的大模型

open-webui:非常不错的大模型webui

github:https://github.com/open-webui/open-webui

开始搭建

第一步选择系统版本:

因为大模型需要的GPU来运算,当然其实CPU也可以,但我们今天讲的是要用GPU来跑的,所以我们在购买服务器的时候,一定要选择GPU服务器,然后看看服务器的系统版本对GPU显卡支持的更好

这里我选择的是阿里的Alibaba Cloud Linux 3.2104 LTS 64位

第二步部署Ollama:

部署ollama非常简单直接输入:

curl -fsSL https://ollama.com/install.sh | sh

等待安装完成后,就如下图:

你还可以输入:ollama 看看一些基本操作

因为我们需要开放API,ollama的开放端口是11434,我们在服务器商那边打开11434端口,然后直接ip:11434进行访问。

这时候我就发现了ollama的一个坑,我们在成功启动ollama的时候就已经直接占用了11434端口,但是我们直接访问发现是无法访问的,通过防火墙各种排查发现是ollama的配置文件里面出现了问题,解决方法如下:

直接输入:

sudo vi /etc/systemd/system/ollama.service

按i进入插入模式,在ExecStart=/usr/local/bin/ollama serve上面插入:Environment=”OLLAMA_HOST=0.0.0.0:11434″

ESC再输入**:wq**回车保存

我们直接重启服务器,重启后输入:ollama

然后在打开ip:11434就可以直接访问了

这样就是成功了

第三步部署:Gemma

gemma是靠ollama来部署的,所以我们直接输入:

ollama run gemma

耐心等待部署完成,如下图:

完成后我们可以直接进行提问,这就好啦!

第四步部署:open-webui

因为open-webui是在Docker里面部署的,所以我们需要先部署Docker,因为我是用的阿里云的Alibaba Cloud Linux 3系统,所以我直接是按照阿里云的官方教程来的,建议你们也是按照自己的系统去安装Docker,我就不过多的说了。

安装open-webui直接输入:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

如果你直接输入的话你就入坑了,如果你的服务器是国内的话,直接下载ghcr.io的镜像简直就是折磨,下一天都不一定下的完,所以我们需要改一下,把ghcr.io改成ghcr.nju.edu.cn再输入:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.nju.edu.cn/open-webui/open-webui:main

这样就嘎嘎的快,像上面这样就成功了

我们再输入:

sudo docker images

查看一下当前的容器,然后再输入我们要启动的容器:

docker run -d ghcr.nju.edu.cn/open-webui/open-webui

如下图:

我们再把open-webui的端口3000去打开一下,直接访问IP:3000就可以啦

注册一个账号进去

在设置里面看看ollama连接状态是成功的就好了,直接用起来吧!


## 关于AI大模型学习指南

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

在这里插入图片描述

二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享,微信扫码免费领取~
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

https://dhexx.cn/news/show-5395749.html

相关文章

Netty中的Reactor模型实现

Netty版本:4.1.17 Reactor模型是Doug Lea在《Scalable IO in Java》提出的,主要是针对NIO的。 其中的主从Reactor模式在Netty中的配置如下: EventLoopGroup bossGroup new NioEventLoopGroup(1); EventLoopGroup workerGroup new NioEv…

音视频开发-- 坑整理

1. 解码时,一定要用avcodec_parameters_to_context(),将流的参数(stream->codecpar)复制到解码器中,否则某些流可能无法正常解码。 //第七步,给给解码器上下文添加参数, avcodec_parameters_to_context(…

ubuntu16因swap分区uuid错误启动慢排查

感觉ubuntu16启动特别慢 dmesg查看如下: [ 10.050123] audit: type1400 audit(1718608189.395:11): apparmor"STATUS" operation"profile_load" profile"unconfined" name"webbrowser-app//oxide_helper" pid708 comm&q…

大数据之flink与hive

其实吧我不太想写flink,因为线上经验确实不多,这也是我需要补的地方,没有条件创造条件,先来一篇吧 flink: 高性能 低延迟 流批一体的分布式计算框架 基于事件时间 对实时数据精准处理 快速响应 支持批处理&#xff0c…

【电脑小白】装机从认识电脑部件开始

前言 在 B 站上刷到了一个很牛逼的电脑装机视频,很适合电脑小白学习,故用文本记录下。 推荐对组装台式电脑有兴趣的小伙伴都去看看这个视频: 原视频链接:【装机教程】全网最好的装机教程,没有之一_哔哩哔哩_bilibil…

C# + easyui 写的一个web项目

用C# easyui 来开发,其实就是为了开发速度,用easyui可以一天写很多页面,比一些低代码平台还快。 登陆页面 主界面 记录数统计 家庭信息采集表 新建家庭 家庭成员 低保、五保人员帮扶情况登记表 低保、五保人员帮扶情况登记表的新增和编辑 治…

LDO电容选型指南

1 为什么电容的选择至关重要 电容往往被人们所忽视,在许多工程师的心目中,电容不过是两个导体加上中间的隔离电解质。总而言之,它们属于最低级的电子元件之一。 工程师们通常通过添加一些电容的办法来解决噪声问题。这是因为他们普遍将电容视…

Android 项目中自定义多个 RadioButton 并排一列选择效果实现

在 Android 项目中,如果你想要实现多个 RadioButton 并排显示,并且只能选择其中一个(类似于单选按钮组的效果),通常你不会直接使用多个 RadioButton 控件,因为标准的 RadioButton 控件在布局中默认是独占一行的。 为了实现多个并排显示的 RadioButton 并只能选择其中一个…

RunMe_Aobut TC103848_UEFIShellFactoryDiagnostics.nsh

:: ***************************************************************************************************************************************************************** :: 20240617 :: 该脚本可以用于BIOS Case TC103848测试,功能包括:在EFIShell环境下运行…

微信小程序,设置页面标题和获取页面标题

设置标题: wx.setNavigationBarTitle({title: 页面标题, })获取标题: const pages getCurrentPages(); const pageUrl pages[pages.length - 1].route; let pageWindow {}; const wxPage __wxConfig.page; if(wxPage && Object.keys(wxPag…