Đề cương luận văn - Nhận dạng văn bản ngôn ngữ latin
Chia sẻ bởi Lê Mạnh Đoan |
Ngày 26/04/2019 |
152
Chia sẻ tài liệu: Đề cương luận văn - Nhận dạng văn bản ngôn ngữ latin thuộc Công nghệ thông tin
Nội dung tài liệu:
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
ĐỀ CƯƠNG CHI TIẾT LUẬN VĂN THẠC SĨ
TÊN ĐỀ TÀI
NHẬN DẠNG VĂN BẢN MỘT SỐ NGÔN NGỮ LA TINH
Giáo viên hướng dẫn : TS. Hồ Văn Canh
Học viên thực hiện : Lê Mạnh Đoan
Lớp : CK14H
Thái Nguyên, tháng 5 năm 2016
LỜI CẢM ƠN
Trước hết cho phép em chân thành cảm ơn các Thầy giáo, Cô giáo trong khoa Công nghệ thông tin và các cán bộ, nhân viên phòng Đào tạo Sau đại học, Trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên đã luôn nhiệt tình giúp đỡ và tạo điều kiện tốt nhất cho em trong suốt quá trình học tập tại trường.
Xin chân thành cảm ơn các anh, các chị và các bạn học viên lớp Cao học CK14H - Trường Đại học Công nghệ Thông tin và Truyền thông – Đại học Thái Nguyên đã luôn động viên, giúp đỡ và nhiệt tình chia sẻ với em những kinh nghiệm học tập, công tác trong suốt khoá học.
Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc đến TS. Hồ Văn Canh, người đã tận tình giúp đỡ em hình thành và hoàn chỉnh luận văn.
Mặc dù đã có nhiều cố gắng, song do sự hạn hẹp về thời gian, điều kiện nghiên cứu và trình độ, luận văn không tránh khỏi những khiếm khuyết. Em chân thành mong nhận được sự đóng góp ý kiến của các Thầy giáo, Cô giáo và đồng nghiệp.
Một lần nữa em xin cảm ơn!
Thái Nguyên, tháng 05 năm 2016
Người thực hiện luận văn
Lê Mạnh Đoan
ĐỀ CƯƠNG CHI TIẾT LUẬN VĂN THẠC SĨ
Tên đề tài:“Nhận dạng văn bản một số ngôn ngữ La tinh”.
Giáo viên hướng dẫn: TS. Hồ Văn Canh
Học viên thực hiện: Lê Mạnh Đoan
Lớp: CK14H
Cơ sở đào tạo: Trường Đại học Công nghệ thông tin và Truyền thông/Đại học Thái Nguyên.
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60 48 01
1. Đặt vấn đề
1.1. Sự cần thiết lựa chọn đề tài
Nhận dạng là một lý thuyết toán học có nhiều ứng dụng trong thực tiễn, như nhận dạng tiếng nói, nhận dạng hình ảnh, nhận dạng chữ ký, phân loại ngôn ngữ , xây dựng tiêu chuẩn bản rõ ứng dụng trong phân tích các bản mã v.v..Trên thế giới cũng như trong nước đã có nhiều nhà nghiên cứu vấn đề này và đã có những phần mềm áp dụng cho nhiều lĩnh vực khác nhau: phần mềm nhận dạng tiếng việt, phần mềm nhận dạng vân tay, phần mềm kiểm soát E-mail trên hệ thống Internet…
Nhận dạng chữ là bài toán rất hữu ích, quen thuộc được ứng dụng nhiều trong thực tế đặc biệt là trong lĩnh vực nhận dạng và phân loại văn bản vì thế đã thu hút nhiều tác giả quan tâm nghiên cứu bằng các phương pháp nhận dạng khác nhau: logic mờ, giải thuật di truyền, mô hình xác suất thống kê, mô hình mạng nơ ron. Đã có rất nhiều công trình nghiên cứu thực hiện việc nhận dạng, phân loại văn bản La Tinh đã đạt tỷ lệ chính xác cao, tuy nhiên các ứng dụng đó cũng chưa thể đáp ứng hoàn toàn nhu cầu của người sử dụng vậy nên ngày nay người ta vẫn tiếp tục nghiên cứu những phương pháp nhận dạng tốt hơn hướng đến dùng cho các thiết bị di động, và các bài toán thời gian thực. Sau khi tìm hiểu về sự tiến bộ của công nghệ nhận dạng chữ La Tinh cũng như các tính năng cơ bản của các phần mềm nhận dạng chữ, được sự tư vấn của giáo viên hướng dẫn, tôi đã lựa chọn được một hướng nghiên cứu thiết thực với đề tài: "Nhận dạng văn bản một số ngôn ngữ La tinh".
Trong khuôn khổ của luận văn, tôi tập trung nghiên cứu, giải quyết bài toán nhận dạng ngôn ngữ tự nhiên dựa vào phân hoạch không gian (nhận dạng theo thống kê toán học), trong đó một lớp ngôn ngữ tiêu biểu được nghiên cứu đó là ngôn ngữ La Tinh như tiếng Anh, tiếng Pháp, v.v.
1.2. Mục tiêu nghiên cứu của đề tài
- Nghiên cứu và xây dựng chương trình nhận dạng văn bản ứng với các ngôn ngữ tự nhiên như : Tiếng Anh, Tiếng Pháp, Tiếng Đức, Tiếng Tây Ban Nha.
2. Đối tượng và phạm vi nghiên cứu
2.1. Đối tượng
- Ngôn ngữ tự nhiên là đối tượng nghiên cứu chính của đề tài
2.2. Phạm vi nghiên cứu
- Tìm hiểu tổng quan về nhận dạng;
- Tìm hiểu các đặc trưng của ngôn ngữ La tinh.
-
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
ĐỀ CƯƠNG CHI TIẾT LUẬN VĂN THẠC SĨ
TÊN ĐỀ TÀI
NHẬN DẠNG VĂN BẢN MỘT SỐ NGÔN NGỮ LA TINH
Giáo viên hướng dẫn : TS. Hồ Văn Canh
Học viên thực hiện : Lê Mạnh Đoan
Lớp : CK14H
Thái Nguyên, tháng 5 năm 2016
LỜI CẢM ƠN
Trước hết cho phép em chân thành cảm ơn các Thầy giáo, Cô giáo trong khoa Công nghệ thông tin và các cán bộ, nhân viên phòng Đào tạo Sau đại học, Trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên đã luôn nhiệt tình giúp đỡ và tạo điều kiện tốt nhất cho em trong suốt quá trình học tập tại trường.
Xin chân thành cảm ơn các anh, các chị và các bạn học viên lớp Cao học CK14H - Trường Đại học Công nghệ Thông tin và Truyền thông – Đại học Thái Nguyên đã luôn động viên, giúp đỡ và nhiệt tình chia sẻ với em những kinh nghiệm học tập, công tác trong suốt khoá học.
Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc đến TS. Hồ Văn Canh, người đã tận tình giúp đỡ em hình thành và hoàn chỉnh luận văn.
Mặc dù đã có nhiều cố gắng, song do sự hạn hẹp về thời gian, điều kiện nghiên cứu và trình độ, luận văn không tránh khỏi những khiếm khuyết. Em chân thành mong nhận được sự đóng góp ý kiến của các Thầy giáo, Cô giáo và đồng nghiệp.
Một lần nữa em xin cảm ơn!
Thái Nguyên, tháng 05 năm 2016
Người thực hiện luận văn
Lê Mạnh Đoan
ĐỀ CƯƠNG CHI TIẾT LUẬN VĂN THẠC SĨ
Tên đề tài:“Nhận dạng văn bản một số ngôn ngữ La tinh”.
Giáo viên hướng dẫn: TS. Hồ Văn Canh
Học viên thực hiện: Lê Mạnh Đoan
Lớp: CK14H
Cơ sở đào tạo: Trường Đại học Công nghệ thông tin và Truyền thông/Đại học Thái Nguyên.
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60 48 01
1. Đặt vấn đề
1.1. Sự cần thiết lựa chọn đề tài
Nhận dạng là một lý thuyết toán học có nhiều ứng dụng trong thực tiễn, như nhận dạng tiếng nói, nhận dạng hình ảnh, nhận dạng chữ ký, phân loại ngôn ngữ , xây dựng tiêu chuẩn bản rõ ứng dụng trong phân tích các bản mã v.v..Trên thế giới cũng như trong nước đã có nhiều nhà nghiên cứu vấn đề này và đã có những phần mềm áp dụng cho nhiều lĩnh vực khác nhau: phần mềm nhận dạng tiếng việt, phần mềm nhận dạng vân tay, phần mềm kiểm soát E-mail trên hệ thống Internet…
Nhận dạng chữ là bài toán rất hữu ích, quen thuộc được ứng dụng nhiều trong thực tế đặc biệt là trong lĩnh vực nhận dạng và phân loại văn bản vì thế đã thu hút nhiều tác giả quan tâm nghiên cứu bằng các phương pháp nhận dạng khác nhau: logic mờ, giải thuật di truyền, mô hình xác suất thống kê, mô hình mạng nơ ron. Đã có rất nhiều công trình nghiên cứu thực hiện việc nhận dạng, phân loại văn bản La Tinh đã đạt tỷ lệ chính xác cao, tuy nhiên các ứng dụng đó cũng chưa thể đáp ứng hoàn toàn nhu cầu của người sử dụng vậy nên ngày nay người ta vẫn tiếp tục nghiên cứu những phương pháp nhận dạng tốt hơn hướng đến dùng cho các thiết bị di động, và các bài toán thời gian thực. Sau khi tìm hiểu về sự tiến bộ của công nghệ nhận dạng chữ La Tinh cũng như các tính năng cơ bản của các phần mềm nhận dạng chữ, được sự tư vấn của giáo viên hướng dẫn, tôi đã lựa chọn được một hướng nghiên cứu thiết thực với đề tài: "Nhận dạng văn bản một số ngôn ngữ La tinh".
Trong khuôn khổ của luận văn, tôi tập trung nghiên cứu, giải quyết bài toán nhận dạng ngôn ngữ tự nhiên dựa vào phân hoạch không gian (nhận dạng theo thống kê toán học), trong đó một lớp ngôn ngữ tiêu biểu được nghiên cứu đó là ngôn ngữ La Tinh như tiếng Anh, tiếng Pháp, v.v.
1.2. Mục tiêu nghiên cứu của đề tài
- Nghiên cứu và xây dựng chương trình nhận dạng văn bản ứng với các ngôn ngữ tự nhiên như : Tiếng Anh, Tiếng Pháp, Tiếng Đức, Tiếng Tây Ban Nha.
2. Đối tượng và phạm vi nghiên cứu
2.1. Đối tượng
- Ngôn ngữ tự nhiên là đối tượng nghiên cứu chính của đề tài
2.2. Phạm vi nghiên cứu
- Tìm hiểu tổng quan về nhận dạng;
- Tìm hiểu các đặc trưng của ngôn ngữ La tinh.
-
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...
Người chia sẻ: Lê Mạnh Đoan
Dung lượng: |
Lượt tài: 3
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)