Konuyu Oyla:
  • Derecelendirme: 0/5 - 0 oy
  • 1
  • 2
  • 3
  • 4
  • 5
MySQL Sounds Like Fonksiyonu
#1
Google Tarzı arama mantığı ile ilgili araştırma yaparken MySQL Sounds Like Fonksiyonu ve Levenshtein Distance Algoritmasını birleştirdiğimde ortaya güzel sonuçlar çıktı, paylaşmak istedim..

Linkleri Görebilmeniz İçin Üye Olmanız Gerekiyor. Üye Olabilmek İçin Lütfen Buraya Tıklayınız. Kodları:

Önce MySql yakasında ana fonksiyonumuzu oluşturuyoruz:
CREATE FUNCTION levenshtein( s1 VARCHAR(255), s2 VARCHAR(255) ) 
 RETURNS INT 
 DETERMINISTIC 
 BEGIN 
   DECLARE s1_len, s2_len, i, j, c, c_temp, cost INT; 
   DECLARE s1_char CHAR; 
   -- max strlen=255 
   DECLARE cv0, cv1 VARBINARY(256); 
   SET s1_len = CHAR_LENGTH(s1), s2_len = CHAR_LENGTH(s2), cv1 = 0x00, j = 1, i = 1, c = 0; 
   IF s1 = s2 THEN 
     RETURN 0; 
   ELSEIF s1_len = 0 THEN 
     RETURN s2_len; 
   ELSEIF s2_len = 0 THEN 
     RETURN s1_len; 
   ELSE 
     WHILE j <= s2_len DO 
       SET cv1 = CONCAT(cv1, UNHEX(HEX(j))), j = j + 1; 
     END WHILE; 
     WHILE i <= s1_len DO 
       SET s1_char = SUBSTRING(s1, i, 1), c = i, cv0 = UNHEX(HEX(i)), j = 1; 
       WHILE j <= s2_len DO 
         SET c = c + 1; 
         IF s1_char = SUBSTRING(s2, j, 1) THEN  
           SET cost = 0; ELSE SET cost = 1; 
         END IF; 
         SET c_temp = CONV(HEX(SUBSTRING(cv1, j, 1)), 16, 10) + cost; 
         IF c > c_temp THEN SET c = c_temp; END IF; 
           SET c_temp = CONV(HEX(SUBSTRING(cv1, j+1, 1)), 16, 10) + 1; 
           IF c > c_temp THEN  
             SET c = c_temp;  
           END IF; 
           SET cv0 = CONCAT(cv0, UNHEX(HEX©)), j = j + 1; 
       END WHILE; 
       SET cv1 = cv0, i = i + 1; 
     END WHILE; 
   END IF; 
   RETURN c; 
 END;

Daha sonra benzeşmeyi yüzde oransal olarak gösteren yardımcı fonksiyonumuzu oluşturuyoruz:
CREATE FUNCTION levenshtein_ratio( s1 VARCHAR(255), s2 VARCHAR(255) ) 
 RETURNS INT 
 DETERMINISTIC 
 BEGIN 
   DECLARE s1_len, s2_len, max_len INT; 
   SET s1_len = LENGTH(s1), s2_len = LENGTH(s2); 
   IF s1_len > s2_len THEN  
     SET max_len = s1_len;  
   ELSE  
     SET max_len = s2_len;  
   END IF; 
   RETURN ROUND((1 - LEVENSHTEIN(s1, s2) / max_len) * 100); 
 END; 

MySQL deki 'sounds like' ifadesi (SOUNDEX fonksiyonu), adından da anlaşılacağı gibi sesçil (fonetik) bir algoritma olup string ifadeleri sesli okunuş esasına göre sıralama amaçlı indexler. Her ne kadar İngilizce kelimelerle etkili sonuç verse de Türkçe kelimelerde de işe yarıyor.

250 bin kelimelik db de (sanal XP, 512 MB RAM) yapılan sorgu ve sonucu:
SELECT word, SOUNDEX(word) soundex,
levenshtein_ratio(word, 'akıl') Benzeme
FROM maddeler WHERE word SOUNDS LIKE ('akıl')
ORDER BY Benzeme DESC

23d759baea.png
Cevapla
#2
Bu çok yararlı paylaşımınız için teşekkürler.

(01-02-2017, Saat: 22:23)delphi-x Adlı Kullanıcıdan Alıntı: Linkleri Görebilmeniz İçin Üye Olmanız Gerekiyor. Üye Olabilmek İçin Lütfen Buraya Tıklayınız.Google Tarzı arama mantığı ile ilgili araştırma yaparken MySQL Sounds Like Fonksiyonu ve Levenshtein Distance Algoritmasını birleştirdiğimde ortaya güzel sonuçlar çıktı, paylaşmak istedim..

Linkleri Görebilmeniz İçin Üye Olmanız Gerekiyor. Üye Olabilmek İçin Lütfen Buraya Tıklayınız. Kodları:

Önce MySql yakasında ana fonksiyonumuzu oluşturuyoruz:
CREATE FUNCTION levenshtein( s1 VARCHAR(255), s2 VARCHAR(255) ) 
 RETURNS INT 
 DETERMINISTIC 
 BEGIN 
   DECLARE s1_len, s2_len, i, j, c, c_temp, cost INT; 
   DECLARE s1_char CHAR; 
   -- max strlen=255 
   DECLARE cv0, cv1 VARBINARY(256); 
   SET s1_len = CHAR_LENGTH(s1), s2_len = CHAR_LENGTH(s2), cv1 = 0x00, j = 1, i = 1, c = 0; 
   IF s1 = s2 THEN 
     RETURN 0; 
   ELSEIF s1_len = 0 THEN 
     RETURN s2_len; 
   ELSEIF s2_len = 0 THEN 
     RETURN s1_len; 
   ELSE 
     WHILE j <= s2_len DO 
       SET cv1 = CONCAT(cv1, UNHEX(HEX(j))), j = j + 1; 
     END WHILE; 
     WHILE i <= s1_len DO 
       SET s1_char = SUBSTRING(s1, i, 1), c = i, cv0 = UNHEX(HEX(i)), j = 1; 
       WHILE j <= s2_len DO 
         SET c = c + 1; 
         IF s1_char = SUBSTRING(s2, j, 1) THEN  
           SET cost = 0; ELSE SET cost = 1; 
         END IF; 
         SET c_temp = CONV(HEX(SUBSTRING(cv1, j, 1)), 16, 10) + cost; 
         IF c > c_temp THEN SET c = c_temp; END IF; 
           SET c_temp = CONV(HEX(SUBSTRING(cv1, j+1, 1)), 16, 10) + 1; 
           IF c > c_temp THEN  
             SET c = c_temp;  
           END IF; 
           SET cv0 = CONCAT(cv0, UNHEX(HEX©)), j = j + 1; 
       END WHILE; 
       SET cv1 = cv0, i = i + 1; 
     END WHILE; 
   END IF; 
   RETURN c; 
 END;

Daha sonra benzeşmeyi yüzde oransal olarak gösteren yardımcı fonksiyonumuzu oluşturuyoruz:
CREATE FUNCTION levenshtein_ratio( s1 VARCHAR(255), s2 VARCHAR(255) ) 
 RETURNS INT 
 DETERMINISTIC 
 BEGIN 
   DECLARE s1_len, s2_len, max_len INT; 
   SET s1_len = LENGTH(s1), s2_len = LENGTH(s2); 
   IF s1_len > s2_len THEN  
     SET max_len = s1_len;  
   ELSE  
     SET max_len = s2_len;  
   END IF; 
   RETURN ROUND((1 - LEVENSHTEIN(s1, s2) / max_len) * 100); 
 END; 

MySQL deki 'sounds like' ifadesi (SOUNDEX fonksiyonu), adından da anlaşılacağı gibi sesçil (fonetik) bir algoritma olup string ifadeleri sesli okunuş esasına göre sıralama amaçlı indexler. Her ne kadar İngilizce kelimelerle etkili sonuç verse de Türkçe kelimelerde de işe yarıyor.

250 bin kelimelik db de (sanal XP, 512 MB RAM) yapılan sorgu ve sonucu:
SELECT word, SOUNDEX(word) soundex,
levenshtein_ratio(word, 'akıl') Benzeme
FROM maddeler WHERE word SOUNDS LIKE ('akıl')
ORDER BY Benzeme DESC

23d759baea.png
Bu çok yararlı paylaşımınız için teşekkürler.
Cevapla
#3
Paylaşım için teşekkürler. Emeğinize sağlık.
There's no place like 127.0.0.1
WWW
Cevapla


Konu ile Alakalı Benzer Konular
Konular Yazar Yorumlar Okunma Son Yorum
  [ÇÖZÜLDÜ] SQLite'dan MySQL'e Aktarma ? Mr.Developer 3 276 22-07-2019, Saat: 20:31
Son Yorum: Mr.Developer
  (ÇÖZÜLDÜ] MySQL Date_format komutu wiseman 1 242 30-05-2019, Saat: 11:30
Son Yorum: wiseman
  MySQL Drop database Yetkisi yhackup 2 447 22-03-2019, Saat: 11:21
Son Yorum: yhackup
  MySQL Workbench Kod Tamamlama Hatası - (Code Completion) hi_selamlar 0 315 23-02-2019, Saat: 11:42
Son Yorum: hi_selamlar
  MySQL malformed trail byte or out of range char yhackup 5 632 31-01-2019, Saat: 09:55
Son Yorum: hi_selamlar



Konuyu Okuyanlar: 1 Ziyaretçi