Các công cụ xử lý tiếng Việt hỗ trợ UNICODE và TCVN 6909:2001

Chia sẻ bởi Nguyễn Việt Vương | Ngày 29/04/2019 | 332

Chia sẻ tài liệu: Các công cụ xử lý tiếng Việt hỗ trợ UNICODE và TCVN 6909:2001 thuộc Bài giảng khác

Nội dung tài liệu:

“Các công cụ xử lý tiếng Việt
hỗ trợ UNICODE
và TCVN 6909:2001”
KS. Đặng Minh Tuấn, Vietkey Group
Tác giả dự thảo tiêu chuẩn TCVN 6909
Tác giả Vietkey, Vietkey Office


www.vietkey.com
[email protected]
84.4.8433873 - 0903413521

CÔNG CỤ XỬ LÝ TIẾNG VIỆT UNICODE / TCVN 6909
1. Tổng quan về xử lý tiếng Việt UNICODE/TCVN 6909
2. Cài đặt các công cụ xử lý tiếng Việt
3. Hướng dẫn Sử dụng các công cụ xử lý tiếng Việt
4. Các câu hỏi thường gặp
5. Thông tin



TỔNG QUAN VỀ XỬ LÝ TIẾNG VIỆT UNICODE/TCVN 6909
Có đầy đủ tất cả con chữ tiếng Việt, cả chữ hoa và chữ thường.
Cho phép tiếng Việt hội nhập với tất cả các ngôn ngữ chính khác trên thế giới.
Không bị các lỗi mất chữ hoặc tranh chấp với các ký tự điều khiển.
Tuân thủ các tiêu chuẩn ISO 10646 và UNICODE, là xu thế phát triển của các tiêu chuẩn và công nghệ hiện đại. Được các hãng cảm kết hỗ trợ trong các sản phẩm mới (Windows 2000, XP...luôn đã có sẵn tiếng Việt trong hệ điều hành).

CÁC CÔNG CỤ XỬ LÝ TIẾNG VIỆT CHÍNH
Công cụ nhập thông tin từ bàn phím (bộ gõ tiếng Việt)
Công cụ chuyển đổi chữ hoa/chữ thường.
Công cụ kiểm tra chính tả tiếng Việt.
Công cụ sắp xếp tiếng Việt.
Các công cụ chuyển mã văn bản, dữ liệu từ các bộ mã/bộ Font cũ sang tiêu chuẩn mới.
CÀI ĐẶT CÁC CÔNG CỤ XỬ LÝ TIẾNG VIỆT
Yêu cầu về phần cứng và phần mềm
Cài đặt Bộ gõ tiếng Việt VIETKEY2000
Cài đặt các công cụ kiểm tra chính tả, chuyển mã, sắp xếp tiếng Việt cho các ứng dụng Word, Excel, PowerPoint (MS Office).
Cài đặt công cụ chuyển mã tiếng Việt cho các trang Web
Cài đặt công cụ chuyển mã cho cơ sở dữ liệu

YÊU CẦU VỀ PHẦN CỨNG CHO TCVN 6909

o Máy tính từ 386 trở lên.
o Bộ nhớ RAM: 16 MB trở lên.
o Ổ cứng HDD: 300 MB (để có thể cài đặt được Win95 và Office 97)

CÀI ĐẶT BỘ GÕ TIẾNG VIỆT VIETKEY2000
o Cài đặt bộ gõ tiếng Việt tối thiếu
o Cài đặt bộ gõ đầy đủ bao gồm cả các font chữ

CÀI ĐẶT BỘ GÕ TIẾNG VIỆT TỐI THIẾU
Không cần cài đặt
Copy VKNT.EXE vào thư mục bất kỳ
Tạo Shortcut cho chương trình

CÀI ĐẶT BỘ GÕ ĐẦY ĐỦ BAO GỒM CẢ CÁC FONT CHỮ
1. Cho đĩa Vietkey vào ổ CD, hoặc cho đĩa Vietkey 1
2. Nhắp chuột (Mouse) vào nút start, chọn vào mục Run
Chọn nút Custom
- Chọn mục VN Unicode Fonts
- Chọn nút Next, Finish
- Khởi động lại máy

CÀI ĐẶT CÁC CÔNG CỤ KIỂM TRA CHÍNH TẢ, CHUYỂN MÃ, SẮP XẾP TIẾNG VIỆT CHO CÁC ỨNG DỤNG WORD, EXCEL, POWERPOINT.
1. Cho đĩa Vietkey vào ổ CD, hoặc cho đĩa Vietkey 1
2. Nhắp chuột (Mouse) vào nút start, chọn vào mục Run
3. Chạy d:vkosetup.exe
CÀI ĐẶT CÁC CÔNG CỤ KHÁC
Cài đặt công cụ chuyển mã tiếng Việt cho các trang Web
Copy chương trình VKCNVR.EXE vào thư mục bất kỳ
Cài đặt công cụ chuyển mã cho cơ sở dữ liệu
Copy chương trình VKDATA.EXE vào thư mục bất kỳ

CÔNG CỤ XỬ LÝ TIẾNG VIỆT UNICODE
VIETKEY GROUP
http://www.vietkey.com
1. Bộ gõ tiếng Việt Unicode đa năng: Vietkey 2000
2. Công cụ chuyển mã văn bản (word,excel…)
3. Công cụ chuyển mã tiếng Việt cho các trang Web
4. Công cụ chuyển mã tiếng Việt cho các hệ quản trị cơ sở dữ liệu
6. Công cụ kiểm tra chính tả tiếng Việt Unicode
7. Công cụ sắp xếp tiếng Việt Unicode
8. Công cụ chuyển đổi chữ hoa/chữ thường Unicode
9. Bộ thư viện xử lý tiếng Việt cho các ngôn ngữ lập trình
10. Công cụ đánh chỉ số trang Web: VinaSeek của Tinhvan
BỘ GÕ TIẾNG VIỆT UNICODE: VIETKEY2000
Cho phép gõ 5 thứ tiếng: Việt, Anh, Nga, Pháp, Đức
Hỗ trợ 9 kiểu gõ tiếng Việt phổ thông: Telex, VNI, TCVN…
Hỗ trợ 44 bảng mã tiếng Việt: ABC, VNI, UINCODE 1,2
Nhiều tính năng thông minh: lặp dấu, khử dấu, gõ tắt…
Một file EXE duy nhất >70K, không cần cài đặt.
Chạy trên nhiều hệ điều hành, ứng dụng: Win9x/NT/2K/ME/XP
Giao diện hiện đại, thân thiện người dùng.
CÔNG CỤ CHUYỂN MÃ VĂN BẢN: Vietkey Office 2.1
(cho Word, Excel, PowerPoint)
Chuyển mã văn bản cho các ứng dụng MS Office 97, MS Office 2000, MS Office XP (Word, Excel, PowerPoint).
Tích hợp công cụ xử lý tiếng Việt vào Menu của các ứng dụng
Tự động đoán nhận bộ mã/font đang sử dụng để chuyển đổi.
Cho phép chuyển qua lại từ 44 bảng mã tiếng Việt khác nhau sang Unicode và ngược lại.
Giữ nguyên mọi định dạng, thuộc tính kiểu dáng font chữ.
Chuyển mã trong 11 vùng text khác nhau: Textbox, Header, Footer
Giữ nguyên các bảng biểu, đồ hoạ và các đối tượng nhúng
Cho phép chuyển mã từng phần hoặc từ một vị trí bất kỳ trong văn bản.
CÔNG CỤ CHUYỂN MÃ TIẾNG VIỆT CHO CÁC TRANG WEB: VietkeyWebConverter 1.3
Chuyển mã các trang Web từ 44 bảng mã/font khác nhau sang Unicode và ngược lại.
Giữ nguyên các thuộc tính, định dạng và kiểu dáng tương đương của font chữ gốc.
Tự động xử lý cả 3 dạng khác nhau của mã ký tự: dạng trực tiếp, dạng &#code; , dạng &nameOfEntity.
Cho phép xuất ra nhiều khuôn dạng: UTF-8, UTF-16, UCS2, Text Only…
Cho phép chuyển từng file một hay cả một thư mục hoặc đệ quy chuyển toàn bộ thư mục chủ và các thư mục con.
Hỗ trợ drag-drop để chọn file trong Windows Explore.
CÔNG CỤ CHUYỂN MÃ TIẾNG VIỆT CHO CÁC CƠ SỞ DỮ LIỆU: VietkeyDataTools 1.2
Chuyển mã các trường text trong CSDL từ 44 bảng mã/font khác nhau sang Unicode (UTF-8) và ngược lại.
Chuyển mã được với hầu như tất cả các CSDL phổ thông: Oracle 7-8i, SQL Server 6-7, Access, Foxpro, dBase, Paradox
Hỗ trợ tất cả các cơ chế truy nhập trong môi trường Windows: DAO, ODBC, ADO.
Cho phép tự động đánh dấu các trường text để chuyển mã
Hiển thị toàn bộ cấu trúc của CSDL hoặc các số liệu hiện có trong các trường, cho phép lựa chọn để chuyển cho từng trường hoặc dệ quy cho cả các nhánh con.
Có các công cụ xử lý khác về CSDL.
CÔNG CỤ KIỂM TRA CHÍNH TẢ TIẾNG VIỆT
Được tích hợp vào menu của Word, Excel, PowerPoint
Tích hợp với Vietkey2000 cho phép kiểm tra chính tả tiếng Việt ở các cửa sổ Text bất kỳ của các ứng dụng bất kỳ (Ctrl-F7).
Kiểm tra chính tả tiếng Việt với hơn 40 bộ mã khác nhau
Có lựa chọn đề nghị sửa lỗi
Có từ điển người dùng có thể bổ xung
Liên thông trong tất cả các ứng dụng
Phát hiện được trên 95% các lỗi đánh máy
CÔNG CỤ SẮP XẾP TIẾNG VIỆT UNICODE
Được tích hợp vào menu và toolsbar của Word, Excel
Sắp xếp tiếng Việt được với hơn 40 bộ mã khác nhau trong đó có Unicode
Trong Excel có thể sắp xếp theo 3 tiêu chí cùng lúc
Có khả năng sắp xếp theo thứ từ từ trái qua phải hoặc sắp xếp theo tên (tách từng thành phần tên-họ-đệm rồi sắp xếp)
Tốc độ sắp xếp nhanh
CÔNG CỤ CHUYỂN ĐỔI CHỮ HOA/THƯỜNG
Do tiếng Việt chữ hoa và thường không cách nhau 32 giá trị mã nên không thể dùng các hàm UpperCase, LowerCase được
Được tích hợp vào menu và toolsbar của Word, Excel
Chuyển đổi chữ hoa/chữ thường tiếng Việt được với hơn 40 bộ mã khác nhau trong đó có Unicode, ABC, VNI
Thao tác đơn giản: bằng phím nóng hoặc click vào biểu tượng trên thanh công cụ.
BỘ THƯ VIỆN LẬP TRÌNH XỬ LÝ TIẾNG VIỆT
Có trên 20 hàm (API) cơ bản cho phép đáp ứng hầu như tất cả các nhu cầu xử lý tiếng Việt.
Hỗ trợ cho hầu như tất cả các ngôn ngữ lập trình: Visual Basic, Visual C, Foxpro, SQL Server, Access…
Cài đặt dễ dàng (không cần đăng ký ocx) chỉ cần copy vào thư mục Windows.
long VK_Convert(char *str_source, char *str_dest);
BYTE VK_Code2Code(BYTE id_source, BYTE id_dest);
long VK_VN2Unicode(char *str_source, LPWSTR str_dest);
long VK_Unicode2VN(LPWSTR str_source, char *str_dest );
BOOL VK_isUniCharUp (long tch);
long VK_lowerUniChar (long tch);
long VK_upperUniChar (long tch);
BYTE VK_defaultCode (BYTE id_code);
long VK_upperStr (char *str_source);
long VK_lowerStr (char *str_source);
long VK_vn2str7bit(BYTE mode,char *str_source,char *str_dest);
long VK_strcmp(char *str_source, char *str_dest);
long VK_convertFont(char *font_source, char *font_dest);
BYTE VK_run (BYTE cmd);
HƯỚNG DẪN SỬ DỤNG CÁC CÔNG CỤ
XỬ LÝ TIẾNG VIỆT
o Nhập thông tin (gõ) tiếng Việt bằng vietkey2000
o Kiểm tra chính tả tiếng Việt
o Công cụ sắp xếp tiếng Việt
o Chuyển đổi chữ hoa/chữ thường
o Chuyển mã văn bản cho các văn bản word /excel /powerpoint
o Chuyển mã cho các trang Web
o Chuyển mã cho các cơ sở dữ liệu

NHẬP THÔNG TIN (GÕ) TIẾNG VIỆT BẰNG VIETKEY2000
Chọn đúng Font chữ tiếng Việt trong các ứng dụng,
Chọn đúng bảng mã (Character Set) trong Vietkey2000,
Chọn đúng kiểu gõ trong Vietkey2000.

CHỌN ĐÚNG FONT CHỮ TIẾNG VIỆT TRONG CÁC ỨNG DỤNG
Arial,
Times New Roman,
Tahoma,
Courier,
Platino Linotype,
Verdana.
CHỌN BẢNG MÃ VÀ KIỂU GÕ TIẾNG VIỆT
CHỌN BẢNG MÃ QUA BIỂU TƯỢNG VIETKEY
QUY TẮC GÕ TIẾNG VIỆT TELEX
Kiểu gõ Telex:
Qui ước, ý nghĩa của các phím:
- f = huyền
- s = sắc
- r = hỏi
- x = ngã
- j = nặng
- aa = â
- aw = ă
- ee = ê
- oo = ô
- w, uw, [ = ư
- ow,] = ơ
- dd = đ
- z = khử dấu (xoá dấu)

VÍ DỤ KIỂU GÕ TELEX
Bạn gõ dòng chữ
Nước chảy đá mòn
Bằng dãy các phím sau:
Nwowcs chayr ddas monf hoặc
N][cs chary ddas mofn

KIỂU GÕ VNI
Bạn gõ dòng chữ
Nước chảy đá mòn
bằng dãy các phím sau
Nu7o71c cha3y d9a1 mo2n hoặc
Nu7o7c1 chay3 d9a1 mon2

CÀI ĐẶT OPTION CHO WORD
CÀI ĐẶT OPTION CHO WORD
KIỂM TRA CHÍNH TẢ TIẾNG VIỆT
CÁC CÂU HỎI THƯỜNG GẶP
Cần nâng cấp máy tính lên Windows 2000?
Không gian của văn bản Unicode tăng lên gấp đôi?
Tất cả các ứng dụng đều chạy được Unicode?
Lỗi chữ i-I, lỗi cách chữ
Lỗi báo Virus Macro.
Vấn đề mã tổ hợp-mã dựng sẵn
Các khuôn dạng, chuyển đổi UTF-8, UCS2

MÃ TỔ HỢP- MÃ DỰNG SẴN
Mã tổ hợp được Microsoft hỗ trợ sắp xếp, chuyển đổi chữ hoa, chữ thường từ Windows 2000, Office 2000
Kích thước văn bản lớn hơn mã dựng sẵn
Mỹ thuật kém, nhiều thao tác xóa, co kéo chữ và dấu tách rời nhau
Cài đặt khó khăn
Tính tương thích kém, không chạy được trên Windows 95,98, Linux
Vấn đề mã tổ hợp-mã dựng sẵn

ĐỊA CHỈ LIÊN HỆ
BAN CÔNG TÁC UNICODE
[email protected]
[email protected]

VIETKEY GROUP
Vietkhang1: 36 Bát đàn, Hà nội, 04-9231330, [email protected]

Vietkhang2: Cư xá 155, Sư Vạn Hạnh Nối Dài, 08-8640401, [email protected]

Việt Tiến Computer: 2/9 Đồng Khởi, Tân Hiệp, Biên Hòa, Đồng Nai,
061-824947, [email protected]



* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Nguyễn Việt Vương
Dung lượng: | Lượt tài: 8
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)