Skip to content

Paraphrases for Sinhala words extracted using pivoting technique.

License

Notifications You must be signed in to change notification settings

brainsharks-fyp17/ppdb-si

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 

Repository files navigation

ppdb-si

Paraphrases for Sinhala words.

ppdb-si-pivot-filtered.tar.xz contains paraphrase words.
Each line contains two or more comma seperated similar words / short phrases.
Sample:

වෝර්ඩන් , අධ්‍යක්ෂක , මුර , පාලිකාව , පාලකයා , අධීක්ෂක ,
කීපෙකදීම , කිහිපයක් , සමහරක් තුළ , ටිකකින් , සුළු මොහොතකින් , 
තරහකින්නේ , කෝපයෙන් , කෝපයට පත් විය , කෝපය , තරහයි ,
හැමවෙලාවකදීම , ඕනෑම වේලාවක , ඕනෑම අවස්ථාවක , සෑම විටම , නිතරම , සැමවිටම ,
අණුකම්පාත් , අනුකම්පාව , කාරුණිකව , දයානුකම්පිත ය , 

This corpus contains 2,049,676 such lines.
Used Googel translate to translate Sinhala words to german, chinese, arabic, french, russian, turkish, thai then back to Sinhala.

Releases

No releases published

Packages

No packages published