haukauntrie.de

finetune-collect

Mit finetune-collect habe ich ein Programm entwickelt, dass verwendet werden kann, um fine-tuning Dateien für OpenAI (aber potentiell auch für andere Plattformen) händisch zu sammeln, zu kuratieren und zu exportieren.

Dieses Programm erfüllt einen Nischen-Zweck, der aber meiner Meinung nach vor allem für Hobbyisten und kleine Vereine nützlich sein könnte.

Das sogenannte fine-tuning wird verwendet, um bereits existierende, große Sprachmodelle (englisch "LLMs") weiter feinabzustimmen, damit sie einen bestimmten Anwendungszweck besser erfüllen können. Dabei setzt man darauf, dass die Sprachmodelle ihre Allgemeine Fähigkeit der generalisierung mit konkreten Beispielen kombinieren, ähnlich wie es ein Angestellter tun würde.

Eine Konversation in finetune-collect, die ein Bild enthält

In vielen Fällen nimmt man hierfür bereits existierende Datensätze und wandelt sie in fine-tuning-Trainingsdateien um.

Möchte man die Trainingsdaten allerdings aus dem Nichts nehmen, also, quasi aus dem Kopf aufschreiben, so bietet finetune-collect eine einfache und flexible Möglichkeit dafür. Mit dem Programm kann man eine Reihe von Beispielkonversationen erstellen, die dem Modell zeigen sollen, wie eine Ideale Konversation aussieht. Dabei unterstützt es sowohl normale Text-Inputs, als auch Bilder oder Funktionsaufrufe. Dadurch können sogar kleine agentische Workflows trainiert werden. Ein Konversations-Beispiel von finetune-collect dass eine Funktion zeigt

Wenn man einen OpenAI API-Token einfügt, kann man auch von der API Vorschläge für Vervollständigungen erhalten, die man dann händisch anpassen kann.

Man kann die gesammelten Daten in einer Projektdatei speichern, um sie später laden zu können. Und natürlich bietet das Programm auch die Möglichkeit, die gesammelten Daten als .jsonl-Datei zu exportieren, die man dann zu OpenAI hochladen kann, um direkt das fine-tuning zu starten.

Das Programm ist für Windows, Web und Linux kompilliert. Allerdings ist es OpenSource und in Godot geschrieben, wodurch es theoretisch auch für Mac, iPhone und Android kompliliert werden könnte.

Hier kann man es direkt im Web ausprobieren.

Ansonsten sind PRs und Issues im GitHub-Repo gerne willkommen!