• Hiện tại trang web đang trong quá hình chuyển đổi và tái cấu trúc lại chuyên mục nên có thể một vài chức năng chưa hoàn thiện, một số bài viết và chuyên mục sẽ thay đổi. Nếu sự thay đổi này làm bạn phiền lòng, mong bạn thông cảm. Chúng tôi luôn hoan nghênh mọi ý kiến đóng góp để chúng tôi hoàn thiện và phát triển. Cảm ơn

Từ Điển Bách Khoa Wiki & MDict

Cho em hỏi Mấy bộ từ điển này có thể dùng ở Windown Mobile 6.0 được không ạ? Hay chỉ dùng cho Windown PC.
 
Mình thử chuyển rồi nhưng chưa hiểu bước thứ 2 chuyển sang tab.dict như thế nào.
Bạn xem lại ví dụ đi, các mục từ sẽ được phân cách với nhau bởi </>, dòng đầu sau dấu này là từ cần tra, dòng tiếp theo là giải nghĩa. Bạn tìm hiểu thêm code HTML nữa nhé.
VD: <br> = xuống dòng,............
dạo này mình chưa rảnh để chuyển mấy file txt nữa. Bạn cứ làm thử 1 file text nhỏ rồi build mdx thì sẽ biết mình cần phải làm gì thôi.
 
co ai có bộ phát âm tiếng nhật trên tử điển này không nhỉ,cho mình xin với,thank
 
Chỉnh sửa cuối:
Cám ơn bạn nhiều, mình đã chỉnh lại đoạn code trong cmd và xuất được file txt rùi, nhưng khi mình dùng MdxBuilder để chuyển .txt thành .mdx thì lại gặp lỗi, mình có một số điểm không hiểu trong khi dùng MdxBuilder mong bạn chỉ giáo:
1. Style file (mình hiểu là format file) là file nào vậy?
2. Phần Option nên chọn phần nào?
3. Cần điền gì vào phần Description?
Mình để nguyên các option mặc định và file format (style file) mình chọn file example_style.txt trong folder MdxBuilder thì nó convert được nhưng nó lại tạo ra file .mdd, mình thử đổi lại thành .mdx, bỏ vào ppc nhưng không chỵ được. Thất bại rùi hichic

Về chuyển file .bgl sang .mdx, mình tìm hiểu nhiều trên mạng, cũng thấy có 2 cách, với cách thứ 2 là không dùng được rùi(bị lỗi khi dùng cho font tiếng Việt,hay nói rộng ra là font unicode, hơn nữa mình không dùng Linux nên..pó tay). Còn cách 1 mình đã từng thử dùng Unpackbgl, nhưng khi chạy thì thấy báo có lỗi trong quá trình unpack, hơn nữa khi unpack xong mình không biết cách nào chuyển sang tab.dict file để buid .mdx nên...dậm chân tại chỗ lun.

Định lên nhờ mod lenguyendu nhưng không thấy reply hichic.:(:(

Còn đoạn code python mình không hiểu lắm vì không dùng ngôn ngữ này, bạn có code của C/C++ không? Mình cũng từng làm về đọc và convert file nên biết một ít về vấn đề này. Nếu không có code bạn có thể cho mình biết cấu trúc của file bgl và file mdx được không, nếu biết cấu trúc của 2 loại file này mình nghĩ có thể viết 1 app nhỏ để convert được.Thanks

1- Theo mình thấy thì bạn thực hiện sai câu lệnh, sau khi chạy Cmd bạn chạy các lệnh DOS sau:
e: ->enter ---->E:\
E:\cd thumucchuafile
***E:\thumucchuafile>java ................ (bỏ order trong câu lệnh của bạn đi)
cái này Lenguyendu có hướng dẫn bằng hình nhưng mình ko nhớ link.

2- Bạn muốn convert babylon dict BGL thì mình biết có hai cách. Cách thứ nhất là dùng Unpackbgl (->Google), sau khi extract được dữ liệu (có dạng ****.bgl.txt), file này sau đó cần được chuyển sang tab.dict file (lấy file này chỉnh sửa rồi build mdx lun) . Mình thấy Thura bên ForumUbuntu thực hiện bằng ngôn ngữ Python (dùng SPE, - http://developer.berlios.de/project/showfiles.php?group_id=4161) - cách này thực hiện với font tiếng Việt khá ổn.
Code:
Mã:
#! /usr/bin/env python
# -*- coding: utf-8 -*-

import re

inputFile = " " #input file ( *.bgl.txt converted with file
outputFile = " " #output file

#Read File
try:
inFile = open(inputFile,"r")
except IOError:
print "Cannot open the input file!"
sys.exit(1)
content = inFile.read()
inFile.close()

#==========
#Conversion
#==========
removeCSS = re.compile("[.#].+\s*{[^}]*?}") #pattern to remove CSS
removeHTML = re.compile("<[^>]*>",re.M) #pattern to remove HTML
removeEmptyLines = re.compile("\s+\n\n", re.M) #pattern to remove Empty Lines
replaceTabs = re.compile("^\t",re.M) #pattern to replace lines starting with tabs
removeBC = re.compile("\s●\s+") #pattern to remove ●
newlinestr = re.escape("\\n")

content = removeCSS.sub("",content) #remove CSS
content = removeHTML.sub("",content) #remove HTML
content = replaceTabs.sub(newlinestr,content) #replace lines starting with Tabs
content = removeEmptyLines.sub("\t",content) #remove Empty Lines
content = content.replace("\n\\n","") #replace new lines before "\n" string
content = removeBC.sub(newlinestr,content) #replace ● with "\n"
inFile.close()

#Write File
try:
outFile = open(outputFile,"w")
except IOError:
print "Cannot open the output file"
outFile.write(content)
outFile.close()

print "Fin"

(*) Cách 2: (Cách này đơn giản hơn nhưng dùng cho từ điển có tiếng Việt mình thấy font nhảy lung tung, chưa khắc phục được)
Dùng cách này bạn cần cài HĐH Ubuntu (Linux) + StarDict + Stardict-tools
Download và cài đặt các file sau để dùng Stardict-tools: dictzip, libmaa, libmysqlclient15off, mysql-common, tất cả các file này đều có trên www.debian.com
Mở Stardict, vào Mycomputer>~/.stardict (tìm đến thư mục .stardict) copy các file BGL cần convert vào (đỡ mất công tìm). Sau đó chạy Terminal,
1> cd ~/.stardict
2> stardict-editor
Lúc này hiện ra cửa sổ Stadict-tools
Tại cửa sổ Stardict-tools>Browse>***.bgl
Chỉnh ô ở dưới bên trái sang BGL file ->Build--->tạo file mới ***.babylon
Browse>***.babylon -> chỉnh ô ở dưới thành Babylon file ->Build -->Xong.

Mình cũng đang làm một số từ điển nhưng chưa xong. Hiện tại mới xong dữ liệu của OALD7 với mấy cái từ điển Synonyms nhưng đang còn chỉnh sửa. Sẽ ráng xong sớm up lên diễn đàn :D

Xin chào bạn zaita, cứ như bài viết thì bạn đã convert bdg sang mdx được rồi pk. Vậy bạn có thể chuyển giùm mình file này được không http://www.mediafire.com/?sharekey=85f469901b65876db94117dade8fc295042864f7c61cd4195621d66e282a0ee8
Mình cũng rất muốn tự tay chuyển lấy nhưng kiến thức lập trình yếu quá, đọc chẳng hiểu gì hết, trong khi chưa học được đành nhờ làm phiền zaita thôi. Cảm ơn
 
Mình dùng từ điển Hán Việt nhưng bị lỗi Font. Anh em nào biết font nào giúp khác phục tình trạng này bảo mình với. Thanks!
 
mình lấy được dữ liệu từ điển cho mdict (Séc Việt) nhưng nhiều từ không được chính xác và còn thiếu mấy vần (Š, Č, ...) nên muốn bổ sung, xin hỏi có thể convert file mdx sang định dạng khác (txt, doc, excel...) để chỉnh sửa đc không?
 
Xin chào bạn zaita, cứ như bài viết thì bạn đã convert bdg sang mdx được rồi pk. Vậy bạn có thể chuyển giùm mình file này được không http://www.mediafire.com/?sharekey=85f469901b65876db94117dade8fc295042864f7c61cd4195621d66e282a0ee8
Mình cũng rất muốn tự tay chuyển lấy nhưng kiến thức lập trình yếu quá, đọc chẳng hiểu gì hết, trong khi chưa học được đành nhờ làm phiền zaita thôi. Cảm ơn
Bác có thể tải Ultra Edit về dùng thử cũng được, hiện mình chuyển qua cách này rồi. bác cứ thử đi, có gì có gửi tin nhắn mình sẽ ráng trả lời sớm. Mà từ điển của bác là loại nào vậy? En - En, En - Việt hay ???
 
Còn đoạn code python mình không hiểu lắm vì không dùng ngôn ngữ này, bạn có code của C/C++ không? Mình cũng từng làm về đọc và convert file nên biết một ít về vấn đề này. Nếu không có code bạn có thể cho mình biết cấu trúc của file bgl và file mdx được không, nếu biết cấu trúc của 2 loại file này mình nghĩ có thể viết 1 app nhỏ để convert được.Thanks
Bạn cũng có thể dùng phần mềm Ultra Edit, cái này cũng có regularexpression nên dùng edit tabdict file rất tốt. Bạn tải về dùng thử nhé.
 
Cho mình hỏi là mình dùng X1. Đã cài PQ & MF VNSysfont rùi. Mình cái MDict tra 1 số chữ là fần fiên âm bị ô vuông. Trong tuỳ chọn mình cũng chọn Font mặc định nhưng vẫn bị ô vuông. VD như tra chữ "effect" thì ko bị, còn chữ "intelligence" thì bị. Có ai bit tại sao ko?:-/
 
http://www.4shared.com/file/128509033/2db52109/LetsJapanNo5x.html
đây là font tiếng nhật,nhưng không hiểu sao mình cài vào là các phím cứng như nghe,dập máy.5 nút điều hướng,nút camera là không hoạt động được nữa,xóa nó đi thì dùng bình thường,các anh xem có thể giúp em được không,e đang dùng máy HTC touch2,thank

gửi mail vào nick yahoo của mình ongcunon1870, mình sẽ gửi cho bạn font LetJapanNo6 dành cho WM6.1 và nếu lấy bộ gõ thì mình send luôn cho nhé:D
 
Sao mình chạy bản 1.0 cho PC không thể hiển thị tiếng Việt ở thanh địa chỉ nhỉ! Các bạn giúp nhé! Thanks!
 
Back
Top