Çok Yakında Yeni Bir Arayüzle karşınızdayız! http://yeni.delphican.com/

Konuyu Oyla:
  • Derecelendirme: 0/5 - 0 oy
  • 1
  • 2
  • 3
  • 4
  • 5
MySQL Sounds Like Fonksiyonu
#1
Google Tarzı arama mantığı ile ilgili araştırma yaparken MySQL Sounds Like Fonksiyonu ve Levenshtein Distance Algoritmasını birleştirdiğimde ortaya güzel sonuçlar çıktı, paylaşmak istedim..

MySQL için Levenshtein fonksiyonu Kodları:

Önce MySql yakasında ana fonksiyonumuzu oluşturuyoruz:
CREATE FUNCTION levenshtein( s1 VARCHAR(255), s2 VARCHAR(255) ) 
 RETURNS INT
 DETERMINISTIC
 BEGIN
   DECLARE s1_len, s2_len, i, j, c, c_temp, cost INT;
   DECLARE s1_char CHAR;
   -- max strlen=255
   DECLARE cv0, cv1 VARBINARY(256);
   SET s1_len = CHAR_LENGTH(s1), s2_len = CHAR_LENGTH(s2), cv1 = 0x00, j = 1, i = 1, c = 0;
   IF s1 = s2 THEN
     RETURN 0;
   ELSEIF s1_len = 0 THEN
     RETURN s2_len;
   ELSEIF s2_len = 0 THEN
     RETURN s1_len;
   ELSE
     WHILE j <= s2_len DO
       SET cv1 = CONCAT(cv1, UNHEX(HEX(j))), j = j + 1;
     END WHILE;
     WHILE i <= s1_len DO
       SET s1_char = SUBSTRING(s1, i, 1), c = i, cv0 = UNHEX(HEX(i)), j = 1;
       WHILE j <= s2_len DO
         SET c = c + 1;
         IF s1_char = SUBSTRING(s2, j, 1) THEN  
           SET cost = 0; ELSE SET cost = 1;
         END IF;
         SET c_temp = CONV(HEX(SUBSTRING(cv1, j, 1)), 16, 10) + cost;
         IF c > c_temp THEN SET c = c_temp; END IF;
           SET c_temp = CONV(HEX(SUBSTRING(cv1, j+1, 1)), 16, 10) + 1;
           IF c > c_temp THEN  
             SET c = c_temp;  
           END IF;
           SET cv0 = CONCAT(cv0, UNHEX(HEX©)), j = j + 1;
       END WHILE;
       SET cv1 = cv0, i = i + 1;
     END WHILE;
   END IF;
   RETURN c;
 END;

Daha sonra benzeşmeyi yüzde oransal olarak gösteren yardımcı fonksiyonumuzu oluşturuyoruz:
CREATE FUNCTION levenshtein_ratio( s1 VARCHAR(255), s2 VARCHAR(255) ) 
 RETURNS INT
 DETERMINISTIC
 BEGIN
   DECLARE s1_len, s2_len, max_len INT;
   SET s1_len = LENGTH(s1), s2_len = LENGTH(s2);
   IF s1_len > s2_len THEN  
     SET max_len = s1_len;  
   ELSE  
     SET max_len = s2_len;  
   END IF;
   RETURN ROUND((1 - LEVENSHTEIN(s1, s2) / max_len) * 100);
 END;

MySQL deki 'sounds like' ifadesi (SOUNDEX fonksiyonu), adından da anlaşılacağı gibi sesçil (fonetik) bir algoritma olup string ifadeleri sesli okunuş esasına göre sıralama amaçlı indexler. Her ne kadar İngilizce kelimelerle etkili sonuç verse de Türkçe kelimelerde de işe yarıyor.

250 bin kelimelik db de (sanal XP, 512 MB RAM) yapılan sorgu ve sonucu:
SELECT word, SOUNDEX(word) soundex,
levenshtein_ratio(word, 'akıl') Benzeme
FROM maddeler WHERE word SOUNDS LIKE ('akıl')
ORDER BY Benzeme DESC

23d759baea.png
Cevapla
#2
Bu çok yararlı paylaşımınız için teşekkürler.

(01-02-2017, Saat: 22:23)delphi-x Adlı Kullanıcıdan Alıntı: Google Tarzı arama mantığı ile ilgili araştırma yaparken MySQL Sounds Like Fonksiyonu ve Levenshtein Distance Algoritmasını birleştirdiğimde ortaya güzel sonuçlar çıktı, paylaşmak istedim..

MySQL için Levenshtein fonksiyonu Kodları:

Önce MySql yakasında ana fonksiyonumuzu oluşturuyoruz:
CREATE FUNCTION levenshtein( s1 VARCHAR(255), s2 VARCHAR(255) ) 
 RETURNS INT
 DETERMINISTIC
 BEGIN
   DECLARE s1_len, s2_len, i, j, c, c_temp, cost INT;
   DECLARE s1_char CHAR;
   -- max strlen=255
   DECLARE cv0, cv1 VARBINARY(256);
   SET s1_len = CHAR_LENGTH(s1), s2_len = CHAR_LENGTH(s2), cv1 = 0x00, j = 1, i = 1, c = 0;
   IF s1 = s2 THEN
     RETURN 0;
   ELSEIF s1_len = 0 THEN
     RETURN s2_len;
   ELSEIF s2_len = 0 THEN
     RETURN s1_len;
   ELSE
     WHILE j <= s2_len DO
       SET cv1 = CONCAT(cv1, UNHEX(HEX(j))), j = j + 1;
     END WHILE;
     WHILE i <= s1_len DO
       SET s1_char = SUBSTRING(s1, i, 1), c = i, cv0 = UNHEX(HEX(i)), j = 1;
       WHILE j <= s2_len DO
         SET c = c + 1;
         IF s1_char = SUBSTRING(s2, j, 1) THEN  
           SET cost = 0; ELSE SET cost = 1;
         END IF;
         SET c_temp = CONV(HEX(SUBSTRING(cv1, j, 1)), 16, 10) + cost;
         IF c > c_temp THEN SET c = c_temp; END IF;
           SET c_temp = CONV(HEX(SUBSTRING(cv1, j+1, 1)), 16, 10) + 1;
           IF c > c_temp THEN  
             SET c = c_temp;  
           END IF;
           SET cv0 = CONCAT(cv0, UNHEX(HEX©)), j = j + 1;
       END WHILE;
       SET cv1 = cv0, i = i + 1;
     END WHILE;
   END IF;
   RETURN c;
 END;

Daha sonra benzeşmeyi yüzde oransal olarak gösteren yardımcı fonksiyonumuzu oluşturuyoruz:
CREATE FUNCTION levenshtein_ratio( s1 VARCHAR(255), s2 VARCHAR(255) ) 
 RETURNS INT
 DETERMINISTIC
 BEGIN
   DECLARE s1_len, s2_len, max_len INT;
   SET s1_len = LENGTH(s1), s2_len = LENGTH(s2);
   IF s1_len > s2_len THEN  
     SET max_len = s1_len;  
   ELSE  
     SET max_len = s2_len;  
   END IF;
   RETURN ROUND((1 - LEVENSHTEIN(s1, s2) / max_len) * 100);
 END;

MySQL deki 'sounds like' ifadesi (SOUNDEX fonksiyonu), adından da anlaşılacağı gibi sesçil (fonetik) bir algoritma olup string ifadeleri sesli okunuş esasına göre sıralama amaçlı indexler. Her ne kadar İngilizce kelimelerle etkili sonuç verse de Türkçe kelimelerde de işe yarıyor.

250 bin kelimelik db de (sanal XP, 512 MB RAM) yapılan sorgu ve sonucu:
SELECT word, SOUNDEX(word) soundex,
levenshtein_ratio(word, 'akıl') Benzeme
FROM maddeler WHERE word SOUNDS LIKE ('akıl')
ORDER BY Benzeme DESC

23d759baea.png
Bu çok yararlı paylaşımınız için teşekkürler.
Cevapla
#3
Paylaşım için teşekkürler. Emeğinize sağlık.
There's no place like 127.0.0.1
WWW
Cevapla


Konu ile Alakalı Benzer Konular
Konular Yazar Yorumlar Okunma Son Yorum
  MySQL json sunucu örneği esistem 3 300 25-12-2019, Saat: 11:04
Son Yorum: Halil Han Badem
  MySQL 8.0 Windows x86 (32Bit) Sürümü Download hi_selamlar 9 462 10-12-2019, Saat: 17:43
Son Yorum: uparlayan
  MySQL de Aynı tabloda ki 2 farklı alanı kıyaslayan sorgu vkamadan 4 465 23-10-2019, Saat: 18:23
Son Yorum: vkamadan
  [ÇÖZÜLDÜ] SQLite'dan MySQL'e Aktarma ? Mr.Developer 3 637 22-07-2019, Saat: 20:31
Son Yorum: Mr.Developer
  (ÇÖZÜLDÜ] MySQL Date_format komutu wiseman 1 488 30-05-2019, Saat: 11:30
Son Yorum: wiseman



Konuyu Okuyanlar: 1 Ziyaretçi