LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2026-01-05 10:10:08 -06:00

Author	SHA1	Message	Date
Ettore Di Giacinto	774ddc60db	chore(ci): specify ubuntu version in pipelines Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-12-03 11:10:18 +01:00
Ettore Di Giacinto	0ca1322b43	chore(ci): correctly pass ubuntu-version Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-12-03 09:58:10 +01:00
Ettore Di Giacinto	8dfeea2f55	fix: use ubuntu 24.04 for cuda13 l4t images (#7418 ) * fix: use ubuntu 24.04 for cuda13 l4t images Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Drop openblas from containers Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-12-03 09:47:03 +01:00
Ettore Di Giacinto	7a5c61b057	fix: configure sbsa packages for arm64 (#7413 ) * fix: configure sbsa packages for arm64 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * tests Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-12-02 18:59:36 +01:00
Ettore Di Giacinto	cfd95745ed	feat: add cuda13 images (#7404 ) * chore(ci): add cuda13 jobs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add to pipelines and to capabilities. Start to work on the gallery Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * gallery Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * capabilities: try to detect by looking at /usr/local Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * neutts Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * backends.yaml Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * add cuda13 l4t requirements.txt Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * add cuda13 requirements.txt Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Pin vllm Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Not all backends are compatible Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * add vllm to requirements Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * vllm is not pre-compiled for cuda 13 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-12-02 14:24:35 +01:00
Ettore Di Giacinto	77c5acb9db	Revert "feat(nvidia-gpu): bump images to cuda 12.8" (#6303 ) Revert "feat(nvidia-gpu): bump images to cuda 12.8 (#6239)" This reverts commit `d9e25af7b5`.	2025-09-17 19:31:43 +02:00
Ettore Di Giacinto	d9e25af7b5	feat(nvidia-gpu): bump images to cuda 12.8 (#6239 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-09-09 13:02:17 +02:00
Ettore Di Giacinto	22067e3384	chore(rocm): bump rocm image, add gfx1200 support (#6065 ) Fixes: https://github.com/mudler/LocalAI/issues/6044 Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-15 16:36:54 +02:00
Richard Palethorpe	d6274eaf4a	chore(build): Rename sycl to intel (#5964 ) Signed-off-by: Richard Palethorpe <io@richiejp.com>	2025-08-04 11:01:28 +02:00
Richard Palethorpe	c07bc55fee	fix(intel): Set GPU vendor on Intel images and cleanup (#5945 ) Signed-off-by: Richard Palethorpe <io@richiejp.com>	2025-07-31 19:44:46 +02:00
Ettore Di Giacinto	a8057b952c	fix(cuda): be consistent with image tag naming (#5916 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-07-26 08:30:59 +02:00
Ettore Di Giacinto	facf7625f3	fix(vulkan): use correct image suffix (#5911 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-07-25 19:20:20 +02:00
Ettore Di Giacinto	98e5291afc	feat: refactor build process, drop embedded backends (#5875 ) * feat: split remaining backends and drop embedded backends - Drop silero-vad, huggingface, and stores backend from embedded binaries - Refactor Makefile and Dockerfile to avoid building grpc backends - Drop golang code that was used to embed backends - Simplify building by using goreleaser Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(gallery): be specific with llama-cpp backend templates Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(docs): update Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(ci): minor fixes Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: drop all ffmpeg references Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix: run protogen-go Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Always enable p2p mode Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Update gorelease file Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(stores): do not always load Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fix linting issues Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Simplify Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Mac OS fixup Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-07-22 16:31:04 +02:00
Ettore Di Giacinto	e1cc7ee107	fix(ci): enable tag-latest to auto (#5738 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-06-27 18:17:01 +02:00
Ettore Di Giacinto	b5b0ab26e7	fix(ci): remove non-existant input from build matrix Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-06-26 21:42:27 +02:00
Ettore Di Giacinto	7c4a2e9b85	chore(ci): ⚠️ fix latest tag by using docker meta action (#5722 ) chore(ci): fix latest tag by using docker meta action Also uniform tagging names Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-06-26 18:40:25 +02:00
Ettore Di Giacinto	b706dddc93	chore(ci): switch to public runners for base images (#5680 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-06-17 22:38:50 +02:00
Ettore Di Giacinto	912c8eff04	chore(ci): use public runner for extra backends (#5657 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-06-16 08:21:18 +02:00
Ettore Di Giacinto	236ac30252	chore(ci): do not specify image-type anymore Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-06-15 17:28:40 +02:00
Ettore Di Giacinto	2d64269763	feat: Add backend gallery (#5607 ) * feat: Add backend gallery This PR add support to manage backends as similar to models. There is now available a backend gallery which can be used to install and remove extra backends. The backend gallery can be configured similarly as a model gallery, and API calls allows to install and remove new backends in runtime, and as well during the startup phase of LocalAI. Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add backends docs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * wip: Backend Dockerfile for python backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * feat: drop extras images, build python backends separately Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixup on all backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * test CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Tweaks Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Drop old backends leftovers Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixup CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Move dockerfile upper Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fix proto Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Feature dropped for consistency - we prefer model galleries Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add missing packages in the build image Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * exllama is ponly available on cublas Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * pin torch on chatterbox Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups to index Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Debug CI * Install accellerators deps Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add target arch * Add cuda minor version Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use self-hosted runners Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * ci: use quay for test images Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups for vllm and chatterbox Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Small fixups on CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chatterbox is only available for nvidia Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Simplify CI builds Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adapt test, use qwen3 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(model gallery): add jina-reranker-v1-tiny-en-gguf Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use reranker from llama.cpp in AIO images Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Limit concurrent jobs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-06-15 14:56:52 +02:00
Ettore Di Giacinto	3be71be696	fix(ci): tag latest against cpu-only image (#5362 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-05-13 22:00:41 +02:00
Ettore Di Giacinto	11c67d16b8	chore(ci): strip 'core' in the image suffix, identify python-based images with 'extras' (#5353 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-05-12 09:36:59 +02:00
Ettore Di Giacinto	8e9b41d05f	chore(ci): build only images with ffmpeg included, simplify tags (#5251 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-27 08:23:25 +02:00
Ettore Di Giacinto	0474804541	fix(ci): remove duplicate entry Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-17 19:51:21 +02:00
Ettore Di Giacinto	c8f6858218	chore(ci): add latest images for core (#5198 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-17 10:00:18 +02:00
Ettore Di Giacinto	b5eeb5c5ab	ci(arm64): run in parallel Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-17 10:24:15 +01:00
Ettore Di Giacinto	b147ad0596	ci: try to build for arm64 Try to use the free arm64 runners from Github: https://github.blog/changelog/2025-01-16-linux-arm64-hosted-runners-now-available-for-free-in-public-repositories-public-preview/ Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-17 10:14:26 +01:00
Ettore Di Giacinto	1006e8a2ed	ci: disable arm jobs Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-01-03 21:58:04 +01:00
Ettore Di Giacinto	9bcfda171b	ci: lower concurrent jobs Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-01-03 20:48:23 +01:00
Ettore Di Giacinto	baee4f7bd5	ci: split jobs Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-01-03 19:23:05 +01:00
Ettore Di Giacinto	286dc32fe0	ci(arm64): try building on self-hosted Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-01-03 19:18:18 +01:00
Ettore Di Giacinto	4dd9ac39b0	chore(ci): comment arm64 job until we find a native CI runner (#4452 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-23 12:34:39 +01:00
Ettore Di Giacinto	8864156300	chore(nvidia-l4t): add l4t arm64 images (#4449 ) chore(nvidia-l4t): add nvidia-l4t arm64 images Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-22 21:29:33 +01:00
Ettore Di Giacinto	bf8f8671d1	chore(ci): adjust parallelism Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-09-23 19:04:36 +02:00
Ettore Di Giacinto	fd70a22196	chore(ci): adjust parallel jobs Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-09-22 15:21:16 +02:00
Ettore Di Giacinto	56f4deb938	chore(ci): split hipblas jobs Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-09-22 15:19:38 +02:00
Ettore Di Giacinto	a9757fb057	fix(cuda): downgrade to 12.0 to increase compatibility range (#2994 ) * fix(cuda): downgrade to 12.0 to increase compatibility range Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * improve messaging Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-07-23 23:35:31 +02:00
Ettore Di Giacinto	2845baecd5	fix(cuda): downgrade default version from 12.5 to 12.4 (#2707 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-07-09 23:13:29 +02:00
Ettore Di Giacinto	466eb82845	ci: add latest tag for vulkan images Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-06-28 09:04:33 +02:00
Ettore Di Giacinto	f93fe30350	ci: vulkan not ready for arm64 yet Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-06-25 18:11:57 +02:00
Ettore Di Giacinto	784ccf97ba	ci: adjust max-parallel Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-06-25 15:14:43 +02:00
Ettore Di Giacinto	e84b31935c	feat(vulkan): add vulkan support to the llama.cpp backend (#2648 ) feat(vulkan): add vulkan support to llama.cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-06-24 20:04:58 +02:00
Ettore Di Giacinto	04b01cd62c	ci: put a cap on parallel runs Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-06-24 18:08:09 +02:00
Ettore Di Giacinto	eb4cd78ca6	ci: run master jobs on self-hosted Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-06-23 10:15:53 +02:00
Ettore Di Giacinto	40ce71855a	ci: disable max-parallelism on master	2024-06-22 23:28:09 +02:00
Ettore Di Giacinto	9c0d0afd09	ci: bump parallel jobs (#2633 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-06-22 23:24:46 +02:00
Rene Leonhardt	43f0688a95	feat: Upgrade to CUDA 12.5 (#2601 ) Signed-off-by: Rene Leonhardt <65483435+reneleonhardt@users.noreply.github.com>	2024-06-19 17:50:49 +02:00
Ettore Di Giacinto	2bbc52fcc8	feat(build): add arm64 core containers (#2421 ) ci: add arm64 container images Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-05-28 10:34:59 +02:00
Ettore Di Giacinto	371d0cc1f7	ci: generate specific image for intel builds (#2374 ) ci: fix intel images until are fixed upstream Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-05-22 23:35:39 +02:00
cryptk	a0aa5d01a1	feat: update ROCM and use smaller image (#2196 ) * feat: update ROCM and use smaller image Signed-off-by: Chris Jowett <421501+cryptk@users.noreply.github.com> * fix: add call to ldconfig to fix AMDs broken library packages Signed-off-by: Chris Jowett <421501+cryptk@users.noreply.github.com> --------- Signed-off-by: Chris Jowett <421501+cryptk@users.noreply.github.com>	2024-05-03 18:46:49 +02:00

1 2

98 Commits