Языковую модель для 8-битного процессора, которая помещается всего в 40 килобайт, опубликовал на GitHub независимый разработчик. Модель Z80-μLM, включая интерфейс чата, представляет собой файл .COM и может работать на историческом процессоре Z80, сообщает автор проекта на GitHub.
Вся система целиком — код вывода, вес модели и интерфейс — занимает 40 КБ. Из-за жёстких аппаратных ограничений автор применил ряд нетривиальных решений: хеширование триграмм, устойчивое к опечаткам, 16-битную целочисленную математику и тщательную обработку обучающих данных.
«Она не будет писать вам электронные письма, но её можно обучить играть в упрощённую версию игры “20 вопросов”, и иногда она способна поддерживать иллюзию простых, но лаконичных разговоров с ярко выраженной индивидуальностью», — заключил он.
По словам разработчика, для генерации данных всего лишь для 20 учебных вопросов было потрачено несколько долларов на API Claude. Модель можно обучать на Python, а затем экспортировать в бинарные файлы для CP/M-совместимых систем.
Ранее «Жуковский.Life» сообщал, как энтузиаст ради эксперимента радикально улучшил охлаждение видеокарты. Моддер под псевдонимом TrashBench установил на видеокарту Asus GeForce RTX 2060 Dual два башенных процессорных кулера, что позволило снизить температуру графического ядра с 74 °C до 43 °C при нагрузке. Наиболее эффективной оказалась именно конфигурация с двумя кулерами, что на 35 градусов ниже штатных показателей.
