Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing

  • Log In
  • Sign Up

newmindai
/
TurkEmbed4Retrieval

Sentence Similarity
sentence-transformers
Safetensors
new
feature-extraction
Generated from Trainer
dataset_size:1840212
loss:MatryoshkaLoss
loss:CachedMultipleNegativesRankingLoss
custom_code
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use newmindai/TurkEmbed4Retrieval with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use newmindai/TurkEmbed4Retrieval with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("newmindai/TurkEmbed4Retrieval", trust_remote_code=True)
    
    sentences = [
        "Yoksulluk çeken devletlerin çoğu",
        "(verb) yerine bir kişi veya şey (kırılan veya verimsiz olan veya kaybedilen veya artık çalışmayan veya bekleneni vermeyen bir başkası) yerine eski jilet bıçağını değiştirdi; Bir ay önce ayrılan sekreteri değiştirmemiz gerekiyor; Sigorta kayıp gelirin yerini alacak; Bu antik vazo asla değiştirilemez.",
        "Homefacts City Report. Portland, Multnomah County, OR'da yer almaktadır. Nüfus 603.650 olup, Portland'ı Multnomah County'nin en büyük şehri ve Oregon eyaletinin en büyük şehri yapmaktadır. Portland'da ortalama Homefacts puanı B olan 169 devlet okulu vardır. Portland için toplam suç oranı ılımlıdır ve şehirde ikamet eden 204 kayıtlı seks suçlusu vardır.",
        "Bununla birlikte, yoksulluğun en az sayıldığı eyaletlerin çoğunda, kredi alan uygun dosyacıların yüzdesi çok daha düşüktür. Nevada'da, sadece% 71.5'i kredilerini talep ederken, Kaliforniya'da sadece% 71'i ABD'deki en düşük oranlar arasında yer aldı."
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
TurkEmbed4Retrieval
1.24 GB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 2 commits
nmmursit's picture
nmmursit
Upload folder using huggingface_hub
e7528ab verified 10 months ago
  • 1_Pooling
    Upload folder using huggingface_hub 10 months ago
  • .gitattributes
    1.57 kB
    Upload folder using huggingface_hub 10 months ago
  • README.md
    19.7 kB
    Upload folder using huggingface_hub 10 months ago
  • config.json
    1.52 kB
    Upload folder using huggingface_hub 10 months ago
  • config_sentence_transformers.json
    205 Bytes
    Upload folder using huggingface_hub 10 months ago
  • model.safetensors
    1.22 GB
    xet
    Upload folder using huggingface_hub 10 months ago
  • modules.json
    349 Bytes
    Upload folder using huggingface_hub 10 months ago
  • sentence_bert_config.json
    53 Bytes
    Upload folder using huggingface_hub 10 months ago
  • special_tokens_map.json
    964 Bytes
    Upload folder using huggingface_hub 10 months ago
  • tokenizer.json
    17.1 MB
    xet
    Upload folder using huggingface_hub 10 months ago
  • tokenizer_config.json
    1.37 kB
    Upload folder using huggingface_hub 10 months ago