Infra

LLMs mit NVIDIA-GPUs in OCI hosten

Published

2 weeks ago

December 16, 2024

Admin

Einführung

Haben Sie sich jemals gefragt, wie Sie ein großes Sprachmodell (LLM) auf Oracle Cloud Infrastructure (OCI) bereitstellen? In dieser Lösung erfahren Sie, wie Sie LLMs mit OCI Compute Bare Metal-Instanzen bereitstellen, die von NVIDIA-GPUs mit einem Inferenzserver namens vLLM beschleunigt werden.

vLLM kann als Server bereitgestellt werden, der das API-Protokoll OpenAI implementiert. Dadurch kann vLLM als Drop-in-Ersatz für Anwendungen mit der OpenAI-API verwendet werden, was bedeutet, dass wir OpenAI-Modelle (wie GPT-3.5 oder GPT-4) auswählen können, um Text für unsere Anforderung basierend auf nur zwei Dingen zu generieren.

Abfrage des ursprünglichen Benutzers
Der Modellname des LLM, für den Sie die Textgenerierung ausführen möchten

Diese LLMs können aus jedem gut geformten Hugging Face Repository (Entwicklerwahl) stammen. Daher müssen wir uns bei Hugging Face authentifizieren, um die Modelle (wenn wir sie nicht aus dem Quellcode erstellt haben) mit einem Authentifizierungstoken abzurufen.

LLMs können auch mit NVIDIA NIM bereitgestellt werden, einer Reihe benutzerfreundlicher Microservices, die für die sichere, zuverlässige Bereitstellung von leistungsstarken KI-Modellinferenzen auf NVIDIA-GPU-beschleunigten Instanzen auf OCI entwickelt wurden.

Germay News Today

LLMs mit NVIDIA-GPUs in OCI hosten

Infra

LLMs mit NVIDIA-GPUs in OCI hosten

Einführung

So viele Unternehmen in Deutschland bieten die Vier-Tage-Woche an

Reichste Familie der Welt: Darum ist sie in Deutschland so unbekannt

Valentin + Renata Lusin: “Let’s Dance”-Stars kehren Deutschland jetzt mit Baby Stella den Rücken

Elon Musk mischt sich in Bundestagswahl ein: SPD-Chef vergleicht Tech-Milliardär mit Putin

Nio expandiert in Deutschland: Smart Driving Technology Center eröffnet

Gastbeitrag von Elon Musk in der “Welt” sorgt für Streit

„Augen zu und durch“: Bayern- und BVB-Stars am Limit

Autobranche: Käufer können mit Rabatten rechnen, dank sinkendem Absatz

Alexander Zverev startet für Deutschland beim United Cup

Verkaufsoffener Sonntag am 29.12.2024: In welchen Städten diesen Sonntag Weihnachts-Shopping möglich ist