📌 XLM-RoBERTa + LoRA ile Türkçe Konu Sınıflandırma (TTC-4900)
Bu model, xlm-roberta-base tabanlı olup LoRA (Low-Rank Adaptation) ile TTC-4900 haber veri seti üzerinde ince ayar yapılmıştır.
Amaç: Türkçe haberleri 7 farklı konu başlığına otomatik sınıflandırmak.
📊 Performans
- Accuracy: %89.4
- Macro-F1: 0.89
| Sınıf | Precision | Recall | F1 |
|---|---|---|---|
| ekonomi | 0.90 | 0.74 | 0.81 |
| siyaset | 0.77 | 0.85 | 0.81 |
| dünya | 0.90 | 0.80 | 0.85 |
| kültür | 0.92 | 0.99 | 0.95 |
| sağlık | 0.96 | 0.99 | 0.97 |
| spor | 0.97 | 0.97 | 0.97 |
| teknoloji | 0.85 | 0.90 | 0.87 |
🚀 Kullanım
from transformers import pipeline
pipe = pipeline(
"text-classification",
model="celalkartoglu/xlm-roberta-ttc4900-merged",
tokenizer="celalkartoglu/xlm-roberta-ttc4900-merged",
return_all_scores=True
)
text = "Merkez Bankası faiz oranlarını sabit tuttu."
print(pipe(text))
- Downloads last month
- 8
Dataset used to train celalkartoglu/xlm-roberta-ttc4900-merged
Evaluation results
- Accuracy on TTC-4900self-reported0.894
- Macro-F1 on TTC-4900self-reported0.890