Xu Hướng 3/2023 # Đề Tài: Môi Trường Xử Lý Tiếng Ê Đê Ứng Dụng Trong Dạy Và Học # Top 8 View | Theolympiashools.edu.vn

Xu Hướng 3/2023 # Đề Tài: Môi Trường Xử Lý Tiếng Ê Đê Ứng Dụng Trong Dạy Và Học # Top 8 View

Bạn đang xem bài viết Đề Tài: Môi Trường Xử Lý Tiếng Ê Đê Ứng Dụng Trong Dạy Và Học được cập nhật mới nhất trên website Theolympiashools.edu.vn. Hy vọng những thông tin mà chúng tôi đã chia sẻ là hữu ích với bạn. Nếu nội dung hay, ý nghĩa bạn hãy chia sẻ với bạn bè của mình và luôn theo dõi, ủng hộ chúng tôi để cập nhật những thông tin mới nhất.

, DOWNLOAD ZALO 0932091562 at BẢNG BÁO GIÁ DỊCH VỤ VIẾT BÀI TẠI: chúng tôi

Published on

Download luận văn đồ án tốt nghiệp với đề tài: Xây dựng môi trường xử lý tiếng Ê Đê ứng dụng trong dạy và học tiếng Ê Đê, cho các bạn làm luận văn tham khảo

1. BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG HOÀNG THỊ MỸ LỆ XÂY DỰNG MÔI TRƯỜNG XỬ LÝ TIẾNG ÊĐÊ ỨNG DỤNG TRONG DẠY VÀ HỌC TIẾNG Ê ĐÊ Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62 48 01 01 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng, năm 2017

2. Công trình được hoàn thành tại: ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: chúng tôi PHAN HUY KHÁNH Phản biện 1: PGS. TS. Lê Mạnh Thạnh Phản biện 2: chúng tôi Huỳnh Xuân Hiệp Phản biện 3: TS. Nguyễn Văn Hiệu Luận án được bảo vệ trước Hội đồng chấm luận án cấp Đại học Đà Nẵng họp tại: Đại học Đà Nẵng Vào hồi 8 giờ 00 ngày 27 tháng 10 năm 2017 Có thể tìm hiểu luận án tại: – Thư viện Quốc gia – Trung tâm Thông tin – Học liệu, Đại học Đà Nẵng

3. DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ [1] Hoàng Thị Mỹ Lệ, Phan Thị Bông, Phan Huy Khánh, “Building a Machine Translation System in a Restrict Context from Ka-Tu Language into Vietnamese”, Proceeding of the International Conference on Knowledge and System Engineering, Springer, KSE 2012, Danang, pp. 167-172, 2012. [2] Hoàng Thị Mỹ Lệ, Vilavong Souksan, Phan Huy Khánh, “Using Unicode in Encoding the Vietnamese Ethnic Minority Languages, Applying for the EDe Language”, Proceeding of the International Conference on Knowledge and System Engineering, Springer, KSE 2013, HaNoi, pp. 137-148, 2013. [3] Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “A Domain indicating method for Ede terminology in building a Vietnamese-Ede bilingual corpus”, Proceeding of The third Asian Conference on Information Systems, ACIS’2014, NhaTrang, pp. 434-439, 2014. [4] Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Giải pháp xây dựng kho ngữ liệu đa ngữ Việt-ÊĐê gán nhãn theo ngữ cảnh”, Tạp chí Khoa học Công nghệ ĐHĐN. Số 1(74), quyển 2, trang: 42-46, 2014. [5] Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Basing on the Ede syllable models to check Ede syllable misspelling, applying to improve the quality of Ede vocabulary corpus”, Proceeding of the International Conference on Advanced Technologies for Communications (ATC’2016), HaNoi, pp 158-162, 2016. [6] Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Xây dựng kho ngữ vựng song ngữ Việt-Ê Đê dựa trên mô hình tương tác Việt-Ê Đê”, Tạp chí Khoa học Công nghệ ĐHĐN, Số 5(114), quyển 2, trang: 36- 40, 2017. [7] Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Deploying environment for processing Ede ethnic minority language in Vietnam”, IEEE International Conference on Systems Science and Engineering (ICSSE), Jul 2017, HoChiMinh, pp. 174-177, 2017. [8] Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Giải pháp chuyển đổi văn bản tiếng Ê Đê dùng phông chữ riêng sang Unicode”, Tạp chí Hội nghị khoa học quốc gia lần thứ X, Nghiên cứu cơ bản và ứng dụng Công nghệ Thông tin-FAIR, trang: 205-211, 2017.

5. 2 Phƣơng pháp nghiên cứu cơ bản Ďƣợc sử dụng trong luận án: nghiên cứu lý thuyết, nghiên cứu thực nghiệm. 4. Cấu trúc của luận án Nội dung luận án gồm phần mở Ďầu, nội dung chính, phần kết luận và các phụ lục. Nội dung luận án gồm 4 chƣơng nhƣ sau: Chương 1: Tiếp cận xử lý ngôn ngữ dân tộc thiểu số Chương 2: Môi trƣờng xử lý tiếng Ê Đê Chương 3: Xử lý tiếng Ê Đê Chương 4: Xây dựng ứng dụng xử lý tiếng Ê Đê 5. Những đóng góp của luận án 1) Đề xuất xây dựng môi trƣờng xử lý tiếng Ê Đê, góp phần Ďịnh hƣớng qui trình nghiên cứu trong xử lý tiếng Ê Đê. 2) Đề xuất giải pháp sử dụng Unicode cho STVB tiếng DTTS nói chung và tiếng Ê Đê nói riêng. 3) Đề xuất xây dựng KNV V-E dựa trên mô hình hợp nhất nguồn dữ liệu song ngữ Việt-Ê Đê và Ê Đê-Việt Ê Đê. 4) Đề xuất mô hình kiểm tra lỗi chính tả âm tiết dựa trên mô hình âm tiết tiếng Ê Đê, góp phần phát hiện lỗi chính tả âm tiết trong văn bản tiếng Ê Đê, kiểm tra các âm tiết tiếng Ê Đê trong KNVV-E. Ngoài ra, nhằm góp phần ứng dụng CNTT trong việc nâng cao chất lƣợng dạy học tiếng Ê Đê, một số ứng dụng ứng dụng xử lý tiếng Ê Đê Ďã Ďƣợc triển khai dựa vào KNV V-E, gồm có: – Tra cứu trực tuyến và ngoại tuyến từ vựng Việt-Ê Đê – Kiểm tra lỗi chính tả văn bản tiếng Ê Đê, – Trợ giúp dịch máy Việt-Ê Đê hỗ trợ cho việc dịch các bài giảng, giáo án từ tiếng Việt sang tiếng Ê Đê. CHƢƠNG 1 VẤN ĐỀ XỬ LÝ NGÔN NGỮ DÂN TỘC THIỂU SỐ 1.1. Xử lý ngôn ngữ tự nhiên 1.1.1. Mã hóa và soạn thảo văn bản 1.1.2. Xây dựng kho ngữ liệu 1.1.3. Tách từ và gán nhãn từ loại 1.1.4. Bài toán dịch máy 1.2. Xử lý tiếng Việt-Kinh 1.2.1. Tiếng Việt trong bối cảnh xử lý ngôn ngữ tự nhiên Ngoài các bài toán và ứng dụng trong XLNNTN, xử lý tiếng Việt còn Ďặt ra các vấn Ďề cần Ďƣợc quan tâm nghiên cứu nhƣ: Tự Ďộng thêm dấu do chữ viết tiếng Việt; kiểm lỗi chính tả, ngữ pháp; xây dựng từ Ďiển, các KNV; phân tích ngữ nghĩa nhằm mục Ďích Ďể máy tính hiểu tiếng Việt; dịch tự Ďộng các văn bản sang ngôn ngữ khác; tóm tắt nội dung các văn bản; nhận dạng chữ in, chữ viết, tiếng nói; trích rút tri thức; tạo sinh văn bản tự Ďộng từ các nguồn tài liệu khác nhau theo ngữ cảnh.

6. 3 Để giải quyết các vấn Ďề Ďƣợc Ďặt ra, xử lý tiếng Việt cần phải tập trung vào việc tạo ra các công cụ và tài nguyên cho xử lý tiếng Việt. Vì vậy, xử lý tiếng Việt vẫn còn là thách thức luôn Ďặt ra 1.2.2. Một số kết quả xử lý tiếng Việt Trong bối cảnh phát triển của ngành CNTT ở Việt Nam, một số bài toán xử lý tiếng Việt Ďã Ďƣợc nghiên cứu và Ďã Ďƣợc một số kết quả: mã hóa Unicode, tách từ, xây dựng kho ngữ liệu, dịch máy. Vấn Ďề Ďa ngữ trong xử lý tiếng Việt trên các hệ quản trị cơ sở dữ liệu không gặp khó khăn, kể cả với các kỹ thuật sắp xếp và tìm kiếm. NSD không cần phải lập trình cũng vẫn xử lý Ďƣợc tiếng Việt trong môi trƣờng Ďa ngữ. 1.2.3. Xu thế và triển vọng trong xử lý tiếng Việt Xử lý tiếng Việt là hƣớng nghiên cứu có tầm quan trọng rất lớn Ďối với sự phát triển và ứng dụng CNTT tại Việt Nam. Xử lý tiếng Việt Ďang có nhu cầu rất lớn ở Việt Nam là do sự bùng nổ của công nghiệp nội dung số và nhiều doanh nghiệp Ďang quan tâm tới lĩnh vực này. 1.3. Xử lý tiếng dân tộc thiểu số Việt Nam 1.3.1. Bảo tồn tiếng các dân tộc thiểu số ở Việt Nam Đứng trƣớc thực trạng tiếng nói của các DTTS ở Việt Nam Ďang Ďứng trƣớc nguy cơ mai một, cộng Ďồng các dân tộc ở Việt Nam và Chính phủ cần có những chƣơng trình nhƣ khuyến khích, vận Ďộng Ďồng bào các DTTS giao tiếp hằng ngày bằng tiếng dân tộc của chính mình. Ngành GDĐT, cần xuất bản nhiều hơn nữa các loại sách song ngữ. Đƣa chƣơng trình giảng dạy tiếng DTTS ở Việt Nam phù hợp với Ďịa bàn vùng DTTS vào các trƣờng phổ thông, trƣờng phổ thông Dân tộc nội trú, trung tâm Giáo dục thƣờng xuyên, trung tâm Học tập cộng Ďồng, trƣờng Dạy nghề, Trung học chuyên nghiệp, Cao Ďẳng và Đại học. Đào tạo Ďội ngũ trí thức ngƣời DTTS ở Việt Nam và tạo Ďiều kiện Ďể trí thức, cán bộ ngƣời DTTS ở Việt Nam trở về phục vụ quê hƣơng. 1.3.2. Hệ thống chữ viết các dân tộc thiểu số ở Việt Nam Số lƣợng các dân tộc thiểu số ở Việt Nam Ďã có và chƣa có chữ viết, Ďƣợc trình bày trong bảng 1.1. Bảng 1.1. Các hệ chữ viết DTTS Việt Nam Hệ chữ viết Số lƣợng DTTS Chữ La tinh 17 Chữ Viết cổ 4 Chữ viết La tinh và chữ viết cổ 4 Chƣa có chữ viết 29 1.3.3. Thực trạng tiếng các dân tộc thiểu số ở Việt Nam Với Ďặc Ďiểm Ďa dạng về dân tộc, nên Việt Nam cũng là quốc gia Ďa ngôn ngữ. Dân tộc Việt Nam nói các ngôn ngữ khác nhau. Ngoài dân tộc Kinh là dân tộc chiếm gần 86% dân số, còn có 54 dân tộc khác, thuộc các ngữ hệ khác nhau thể hiện trong bảng các ngôn ngữ các dân tộc Việt Nam. Trên cả nƣớc hiện nay có trên 20 tỉnh thành Ďang tổ chức dạy tiếng

7. 4 DTTS cho gần 110.000 học sinh thuộc 7 dân tộc: H’Mông, Ê Đê, Gia Rai, Ba Na, Chăm, Khơ Me, Hoa. Nhiều tỉnh thành Ďã triển khai thực hiện dạy tiếng DTTS cho học sinh, cán bộ, công chức, viên chức, các sở và các ban ngành dƣới nhiều hình thức. GDĐTcũng Ďã xây dựng một số chƣơng trình giáo dục song ngữ, Ďƣa vào giảng dạy trong các trƣờng tiểu học và trƣờng phổ thông Dân tộc nội trú. 1.3.4. Xử lý tiếng Ê Đê vận dụng kết quả xử lý tiếng Việt Qua các nghiên cứu tổng quan về XLNNTN, xử lý ngôn ngữ DTTS, xử lý tiếng Việt, xử lý tiếng Ê Đê; dựa vào sự gần gũi giữa tiếng Việt và tiếng Ê Đê; Ďể giảm thiểu kinh phí và Ďiều kiện nghiên cứu kho học; kế thừa và phát triển từ những gì Ďã, Ďang và sẽ có của các kết quả nghiên cứu, vận dụng kết quả xử lý tiếng Việt cho xử lý tiếng Ê Đê Ďƣợc so sánh và nhận Ďịnh trong bảng 1.2. Bảng 1.2. So sánh và nhận định vấn đề xử lý tiếng Việt và tiếng Ê Đê Vấn đề XLNNTN Tiếng Việt Tiếng Ê Đê Mã hoá Unicode Đã có Chƣa có Đề xuất: Luận án tập trung nghiên cứu mã hoá Unicode các chữ cái tiếng Ê Đê không có trong tiếng Việt. Dùng phông Unicode Đã dùng Chƣa dùng Đề xuất: Luận án tập trung nghiên cứu dùng phông chữ Unicode cho việc hiển thị chữ viết tiếng Ê Đê, không dùng phông chữ tiếng Ê Đê riêng nhƣ hiện nay. Hiển thị chữ viết với phông chữ Unicode Đã có bộ gõ Unikey, VietKey, VNWinKey Chƣa có Đè xuất: Luận án tập trung nghiên cứu vấn Ďề hiển thị chữ viết tiếng Ê Đê dùng phông chữ Unicode và kế thừa bộ gõ tiếng Việt. Xây dựng KNV Đã có Chƣa có Đề xuất: Luận án tập trung xây dựng KNVV-E, kế thừa kho ngữ vựng tiếng Việt Ďã có chia sẻ cho các hoạt Ďộng nghiên cứu. Tách từ Khó khăn về vấn Ďề nhập nhằng. Đã có công cụ tách từ vnTokenizer chia sẻ cho mục Ďích nghiên cứu. Khó khăn về vấn Ďề nhập nhằng. Chƣa có công cụ tách từ chia sẻ cho mục Ďích nghiên cứu. Đề xuất: Luận án cần chọn giải pháp kế thừa công cụ vnTokenize Ďể tách từ tiếng Việt ứng với từ tiếng Ê Đê, theo cách tiếp cận bổ sung mục từ mới vào KNV mở rộng của công cụ vnTokenize. Dịch máy Việt-Anh, chƣa xử lý hết các trƣờng hợp nhập nhằng. Việt-Ê Đê chƣa xử lý các trƣờng hợp nhập nhằng và các từ không có trong KNV Đề xuất: Luận án tập trung nghiên cứu ứng dụng trợ giúp dịch Việt- Ê Đê cho việc dịch các bài học song ngữ Việt-Ê Đê, các giáo án, giáo trình từ tiếng Việt sang tiếng Ê Đê.

9. 6 – Mức tiếp theo là hợp nhất nguồn dữ liệu song ngữ Việt- Ê Đê và Ê Đê-Việt trong xây dựng KNV song ngữ Việt-Ê Đê. – Mức thứ ba là quản lý KNV, xây dựng và chia sẻ các công cụ kỹ thuật, các ứng dụng cho các hoạt Ďộng nghiên cứu xử lý tiếng Ê Đê. – Mức cuối cùng Ďại diện cho miền triển khai ứng dụng xử lý tiếng Ê Đê trong dạy và học tiếng Ê Đê, bao gồm các hoạt Ďộng nhƣ: tra cứu vựng, kiểm tra lỗi chính tả văn bản tiếng Ê Đê, hỗ trợ dịch Việt-Ê Đê dựa trên kho ngữ vựng song ngữ Việt- Ê Đê có Ďƣợc từ các mức dƣới. Hình 1.1 thể hiện các mức của hệ thống phân cấp chức năng trong môi trƣờng xử lý tiếng Ê Đê. 1.5. Kết luận chƣơng 1 Luận án tập trung vào bốn giải pháp chính: 1) Đề xuất xây dựng môi trƣờng xử lý tiếng Ê Đê, góp phần Ďịnh hƣớng qui trình nghiên cứu trong xử lý tiếng Ê Đê. 2) Đề xuất giải pháp sử dụng Unicode cho STVB tiếng DTTS nói chung và tiếng Ê Đê nói riêng. 3) Đề xuất xây dựng KNV V-E dựa trên mô hình hợp nhất nguồn dữ liệu song ngữ Việt-Ê Đê và Ê Đê-Việt Ê Đê. 4) Đề xuất mô hình kiểm tra lỗi chính tả âm tiết dựa trên mô hình âm tiết tiếng Ê Đê, góp phần phát hiện lỗi chính tả âm tiết trong văn bản tiếng Ê Đê, kiểm tra các âm tiết tiếng Ê Đê trong KNVV-E. Ngoài ra, nhằm góp phần ứng dụng CNTT trong việc nâng cao chất lƣợng dạy học tiếng Ê Đê, một số ứng dụng ứng dụng xử lý tiếng Ê Đê Ďã Ďƣợc triển khai dựa vào KNV V-E, gồm có: – Tra cứu trực tuyến và ngoại tuyến từ vựng Việt-Ê Đê – Kiểm tra lỗi chính tả văn bản tiếng Ê Đê, – Trợ giúp dịch máy Việt-Ê Đê Từ Ďịnh hƣớng nhiệm vụ nghiên cứu nêu trên, các nội dung nghiên cứu sẽ Ďƣợc trình bày trong các chƣơng tiếp theo. CHƢƠNG 2 MÔI TRƢỜNG SOẠN THẢO TIẾNG Ê ĐÊ 2.1. Giới thiệu tiếng Ê Đê Hình 1.1. Hệ thống phân cấp chức năng trong môi trường xử lý tiếng Ê Đê

10. 7 2.1.1. Sự ra đời chữ viết Ê Đê 2.1.2. Đặc điểm ngữ âm Ê Đê 2.1.3. Đặc điểm từ vựng Ê Đê 2.1.4. Đặc điểm ngữ pháp Ê Đê 2.2. Soạn thảo văn bản tiếng Ê Đê 2.2.1. Xử lý chữ viết tiếng các dân tộc thiểu số ở Việt Nam Kết quả nghiên cứu về xử lý chữ viết tiếng các DTTS ở Việt Nam có những ƣu Ďiểm và nhƣợc Ďiểm sau: Ưu điểm: góp phần tin học hóa các văn bản tiếng DTTS, giải quyết Ďƣợc vấn Ďề hiển thị chữ DTTS trên máy tính cho các dân tộc Chăm, Thái, Ê Đê, Gia Rai, Ba Na, M’Nông, Ê Đê, Xơ Đăng, Cơ Ho, Xê Đăng, Sán Chay, tạo Ďiều kiện cho Ďồng bào các DTTS tiếp cận với những ứng dụng trong lĩnh vực CNTT, cũng nhƣ các ứng dụng khoa học công nghệ mới. Nhược điểm: sử dụng bộ mã chuẩn có sẵn là ASCII và tạo phông chữ riêng theo bảng mã này, chỉ khắc phục Ďƣợc tính cục bộ, ứng dụng trong phạm vi hẹp của một số bộ phông chữ của các công trình nghiên cứu xây dựng bộ gõ cho STVB. Để hiển thị Ďƣợc chữ viết tiếng các DTTS ở Việt Nam, trên máy phải có phông chữ ứng với bộ gõ của tiếng dân tộc Ďó. Từ những thực trạng xử lý chữ viết tiếng các DTTS ở Việt Nam trên máy tính, vấn Ďề mã hóa Unicode trong STVB tiếng các DTTS ở Việt Nam là việc làm rất cần thiết và phải làm càng sớm càng tốt. 2.2.2. Soạn thảo văn bản tiếng dân tộc thiểu số Hầu hết 21 DTTS ở Việt Nam có chữ viết sử dụng bộ chữ cái Latinh, có dấu và thanh âm gần giống tiếng Việt. Một số chữ viết tiếng DTTS có chữ cái, dấu và thanh âm biến Ďổi nhƣng không nhiều. Trên cơ sở Ďó, luận án Ďề xuất giải pháp hiển thị văn bản Unicode tiếng các DTTS trong môi trƣờng Ďa ngữ. Các tiêu chí Ďƣợc Ďặt ra trong giải pháp: Áp dụng cho tiếng các DTTS có chữ viết sử dụng bộ chữ cái Latinh. Mã hóa bộ chữ viết tiếng DTTS trong bảng mã Unicode, kế thừa bộ gõ tiếng Việt, thống nhất dùng phông chữ Unicode trong STVB. Giải pháp hiển thị chữ viết tiếng DTTS trong môi trƣờng Ďa ngữ Ďƣợc Ďề xuất theo mô hình hiển thị chữ viết tiếng DTTS trên văn bản Unicode Hình 2.2. Mô hình hiển thị chữ viết tiếng DTTS trên văn bản Unicode

11. 8 (Hình 2.2). Hoạt động trong mô hình Bước 1: nhóm bộ chữ cái tiếng DTTS theo ba nhóm Nhóm 1 là các chữ cái có trong bảng chữ cái tiếng Việt, có trong Unicode. Nhóm 2 là các chữ cái không có trong bảng chữ cái tiếng Việt mà có trong Unicode. Nhóm 3 là các chữ cái không có trong bảng chữ cái tiếng Việt cũng không có trong Unicode. Bước 2: ánh xạ chữ cái nhóm 2 và nhóm 3 vào Unicode Ďể xác Ďịnh giá trị hexa trong Unicode tƣơng ứng với các chữ cái nhóm 2 và nhóm 3. Bước 3: qui Ďịnh cách gõ cho các chữ cái nhóm 2 và nhóm 3. Bước 4: xây dựng môi trƣờng tƣơng tác vào bộ gõ tiếng Việt WinVNKey Ďể hiển thị Ďƣợc chữ viết tiếng DTTS trong văn bản Unicode và trong các trình ứng dụng có STVB tƣơng tự nhƣ tiếng Việt. Giải pháp hiển thị chữ viết tiếng DTTS Việt Nam trong môi trƣờng Ďa ngữ, góp phần giải quyết vấn Ďề sử dụng Unicode cho STVB tiếng các DTTS ở Việt Nam trong môi trƣờng Ďa ngữ và hiển thị chữ viết tiếng DTTS trong các trình ứng dụng có STVB. 2.2.3. Soạn thảo văn bản tiếng Ê Đê Áp dụng giải pháp hiển thị tiếng DTTS trong văn bản Unicode cho STVB tiếng Ê Đê, các bƣớc Ďƣợc thực hiện nhƣ sau: Bước 1: nhóm các chữ cái tiếng Ê Đê theo ba nhóm (Bảng 2.2). Bảng 2.2. Bảng phân nhóm bảng chữ cái Ê Đê Nhó m Chữ cái tiếng Ê Đê 1 A a Ă ă Â â E e Ê ê I i O o Ô ô Ơ ơ U u Ƣ ƣ B b D d Đ Ď G g H h J j K k L l M m N n P p R r S s T t W w Y y 2 Ƀ ƀ Č č Ĕ ĕ Ĭ ĭ Ñ Ñ Ŏ ŏ Ŭ ŭ 3 Ê ê ô Ơ ơ Ƣ ƣ Bước 2: chữ cái nhóm 2 và nhóm 3 Ďƣợc ánh xạ vào bảng mã Unicode trong các phạm vi chứa: kí tự La tinh bổ sung (H00A0:H00FF), kí tự La tinh mở rộng (H0100:H024F), dấu phụ kết hợp (H0300:H036F). Việc ánh xạ chữ cái nhóm 2 và nhóm 3 vào Unicode Ďƣợc thực hiện qua bộ công cụ ánh xạ Unicode. Các chữ cái thuộc nhóm 3, Ďƣợc chọn mã hóa theo dạng mã tổ hợp với hai kí tự: kí tự chữ cái và dấu trăng . Kết quả ánh xạ các chữ cái nhóm 2 và và nhóm 3 vào Unicode thể hiện trong bảng 2.3. Bước 3: qui Ďịnh cách gõ cho chữ cái nhóm 2 và nhóm 3. Kí tự dấu ngã “~” Ďƣợc chọn thay cho dấu gạch ngang trong chữ Ƀ, ƀ và dấu ~ trên chữ Ñ, ñ. Kí tự dấu “^” Ďƣợc chọn thay cho dấu trăng trên các chữ có dấu trăng.

13. 10 ViệtKey) Hướng mở Không Không Có Phím phụ kết hợp 12 phím Kết hợp nhƣ telex, VNI Phím ~ và phím ^ 2.3. Sử dụng Unicode 2.3.1. Sử dụng Unicode trong soạn thảo văn bản Trong STVB việc sử dụng nhiều bảng mã khác nhau trong cùng một nƣớc là một trở ngại lớn trong việc phát triển các hệ thống thông tin lớn. Unicode không chỉ giải quyết về mặt kĩ thuật hiển thị phông chữ mà còn tạo tiền Ďề cho sự phát triển kĩ thuật xử lí ngôn ngữ trên máy tính, xây dựng các giải pháp sửa lỗi chính tả và ngữ pháp tự Ďộng trên máy tính, là xu hƣớng tất yếu trong sự phát triển mạnh mẽ của internet hiện nay… Unicode là giải pháp quốc tế, cho mọi ngôn ngữ trên thế giới trong việc trao Ďổi thông tin. 2.3.2. Giải pháp chuyển đổi văn bản tiếng DTTS sử dụng phông chữ riêng sang Unicode Các văn bản tiếng DTTS ở Việt Nam có chữ viết sử dụng ký tự chữ Latinh, phần lớn không sử dụng phông chữ Unicode mà sử dụng phông chữ riêng. Sử dụng phông chữ riêng trong STVB là một khó khăn trong việc trao Ďổi và phát triển các hệ thống thông tin. Từ thực trạng trên, Ďể góp phần giải quyết những khó khăn trong việc trao Ďổi, sử dụng các văn bản tiếng DTTS dùng phông chữ riêng, luận án Ďề xuất giải pháp chuyển Ďổi văn bản tiếng các DTTS dùng phông chữ riêng sang phông chữ Unicode. Giải pháp chuyển Ďổi văn bản tiếng DTTS dùng phông chữ riêng sang phông chữ Unicode Ďƣợc trình bày trong Hình 2.4. Trong giải pháp này, có kế thừa chức năng xác Ďịnh giá trị hexa cho các chữ cái nhóm 2 và nhóm 3 và chức năng qui Ďịnh cách gõ trong bộ gõ H&TES. Chức năng qui Ďịnh cách gõ trong bộ công cụ H&TES, Ďƣợc kế thừa cho chức năng xác Ďịnh kí tự Ďã sử dụng trong văn bản tiếng DTTS với phông chữ riêng và Ďƣợc ánh xạ vào chữ cái nhóm 2 và nhóm 3. Sau khi Ďã xác Ďịnh Ďƣợc giá trị hexa và kí tự Ďã sử dụng trong văn bản cần chuyển Ďổi, sẽ Ďƣợc lƣu vào CSDL. Đây chính là nguồn dữ liệu Ďầu vào Hình 2.4. Mô hình chuyển đổi văn bản tiếng DTTS dùng phông chữ riêng sang phông chữ Unicode

14. 11 cho chức năng chuyển Ďổi văn bản tiếng DTTS dùng phông chữ riêng sang Unicode. Giải pháp chuyển Ďổi văn bản tiếng DTTS dùng phông chữ riêng sang Unicode, Ďã góp phần giải quyết những khó khăn trong việc trao Ďổi các văn bản tiếng DTTS dùng phông chữ riêng. 2.3.3. Chuyển đổi văn bản tiếng Ê Đê dùng phông chữ riêng về Unicode Trong soạn thảo văn bản tiếng Ê Đê, việc chuyển từ dùng phông chữ riêng sang Unicode, là công việc chƣa thể thực hiện Ďƣợc trong ngày một ngày hai. Trƣớc mắt, Ďể giải quyết những khó khăn trong việc trao các văn bản tiếng Ê Đê dùng phông chữ riêng trên internet hay giữa các máy tính. Dựa vào giải pháp chuyển Ďổi văn bản tiếng DTTS dùng phông chữ riêng sang Unicode, luận án Ďề xuất xây dựng bộ chuyển Ďổi văn bản tiếng Ê Đê dùng phông chữ riêng sang phông chữ Unicode, Ďƣợc Ďặt tên là CEDU. Kịch bản xây dựng bộ chuyển đổi CEDU Sử dụng bộ chuyển Ďổi H&TES Ďã Ďƣợc Ďề xuất trong mục 2.2.3 Ďể tạo CSDL chứa giá trị hexa và tập kí tự Ďƣợc gõ tƣơng ứng với các chữ cái nhóm 2 và nhóm 3. Dựa vào CSDL chứa tập giá trị hexa và tập kí tự Ďƣợc gõ tƣơng ứng với các chữ cái nhóm 2 và nhóm 3, Ďể thực hiện chuyển Ďổi file văn bản tiếng Ê Đê ở các dạng (TXT, DOC, DOCX, RFT, XML) dùng phông chữ riêng sang file văn bản tiếng Ê Đê dùng phông chữ Unicode. Kết quả thực nghiệm Dữ liệu Ďầu vào Ďƣợc lấy từ các bản tin Hệ phát thanh dân tộc VOV 4. Các bản tin này sử dụng phông chữ TayNguyenKey, kiểu gõ VNI và bộ gõ UniKey. Kết quả có Ďƣợc sau khi qua bộ CEDU Ďã Ďƣợc kiểm tra thủ công trên các bản gốc và nhận thấy rằng CEDU Ďã chuyển Ďổi Ďƣợc hết tất cả các tập kí tự Ďƣợc gõ theo phông chữ TayNguyenKey về chữ cái tiếng Ê Đê với phông chữ Unicode. So sánh đánh giá Bộ chuyển Ďổi CEDU thực hiện chuyển Ďổi Ďƣợc cho các tệp có phần mở rộng TXT, DOC, DOCX, RTF, XML, chứ không chỉ giới hạn các tệp chỉ có phần mở rộng TXT hoặc RTF nhƣ chức năng chuyển Ďổi bảng mã tiếng Việt của Unikey ToolKit trong bộ gõ Unikey. Bộ chuyển Ďổi CEDU Ďã góp phần giải quyết những bất cập trong trao Ďổi các văn bản tiếng Ê Đê dùng phông chữ riêng trên internet hay giữa các máy tính với nhau, cũng nhƣ việc sử dụng lại các nguồn dữ liệu Ďiện tử hiện có trong nghiên cứu xử lý tiếng Ê Đê. 2.4. Kiểm tra chính tả âm tiết tiếng Ê Đê 2.4.1. Âm tiết tiếng Ê Đê a) Khái niệm âm tiết b) Cấu tạo âm tiết tiếng Ê Đê

15. 12 Cấu tạo âm tiết Ê Đê thể hiện trong hình 2.5. 2.4.2. Phát hiện lỗi chính tả âm tiết tiếng Ê Đê Trong xử lý tiếng Ê Đê, xây dựng các KNV Ďơn ngữ, song ngữ Việt- Ê Đê chủ yếu dựa vào nguồn từ Ďiển giấy. Để chuyển các mục từ trong từ Ďiển giấy vào các KNV, phải có thao tác cập nhật thủ công. Trong qúa trình cập nhật thủ công không thể tránh khỏi các lỗi chính tả. Thêm vào Ďó, ngƣời nhập dữ liệu có thể không biết tiếng Ê Đê và chƣa quen cách gõ chữ cái tiếng Ê Đê, vì vậy khó phát hiện Ďƣợc các lỗi do gõ nhầm ngay tại lúc gõ. Để kiểm tra lỗi chính tả tiếng Ê Đê trong KNVV-E và từng bƣớc giải quyết bài toán kiểm tra chính tả tiếng Ê Đê, luận án Ďề xuất giải pháp dựa trên mô hình cấu tạo âm tiết tiếng Ê Đê Ďể kiểm tra chính tả tiếng Ê Đê ở mức âm tiết. Dựa trên 22 kiểu âm tiết khác nhau trong mô hình âm tiết tiếng Ê Đê và các trƣờng hợp kiểu âm tiết không có phần Ďầu, luận án Ďã rút gọn 22 kiểu âm tiết còn 8 kiểu âm tiết và bổ sung 7 kiểu âm tiết không có phần Ďầu. Rút gọn 22 kiểu âm tiết thành 8 kiểu âm tiết là gộp các trƣờng hợp phần Ďầu âm tiết là một phụ âm hay tổ hợp hai phụ âm và ba phụ âm thành một trƣờng hợp chung là phần Ďầu âm tiết. Trong 7 kiểu âm tiết bổ sung có một trƣờng hợp kiểu âm tiết không có trong từ Ďiển Ďó là trƣờng hợp nguyên âm + bán nguyên âm. Vì vậy trong 7 kiểu âm tiết bổ sung chỉ còn 6 kiểu âm tiết không có phần Ďầu. Tập mô hình âm tiết tiếng Ê Đê Ďƣợc Ďề xuất trong luận án gồm có 14 mô hình âm tiết, Ďƣợc trình bày trong Bảng 2.9. Trong Ďó, Cb là kí hiệu cho phần Ďầu, S1 là kí hiệu cho âm Ďệm, V là kí hiệu cho âm chính, S2 là kí hiệu cho bán nguyên âm sau âm chính, Ce là kí hiệu cho âm cuối. Bảng 2.9. Mô hình âm tiết tiếng Ê Đê Stt Mô hình âm tiết Ví dụ Stt Mô hình âm tiết Ví dụ 1 V ĭ (sơ sinh) 8 CbVCe mđơt (ngắn) 2 VCe ung (chồng) 9 CbVS2 hmlei (bông gòn) 3 VS1Ce ơih (vâng) 10 CbVSCe hmiêt (gói ghém) 4 S1V iŭ (bơm) 11 CbS1V thiê (xui khiến) 5 S1VS2 iêu (gọi) 12 CbS1VS2 miêu (con mèo) 6 S1VCe uan (số) 13 CbS1VCe Mđhiăr (lặp lại) 7 CbV ƀô (mặt) 14 CbS1VSCe mbhuôih (chuốt) Tập mô hình âm tiết tiếng Ê Đê này là cơ sở cho giải pháp kiểm tra lỗi chính tả tiếng Ê Đê ở mức âm tiết. Hình 2.5. Mô hình cấu tạo âm tiết tiếng Ê Đê

17. 14 3.1.2. Môi trường hợp nhất nguồn dữ liệu song ngữ Việt-Ê Đê và Ê Đê- Việt Môi trƣờng hợp nhất Ďƣợc thực hiện qua hai mô Ďun thực hiện hợp nhất: mô Ďun tƣơng tác Ê Đê-Việt và mô Ďun tƣơng tác Việt-Ê Đê. 3.1.3. Đánh giá mô hình hợp nhất nguồn dữ liệu Với bối cảnh xử lý tiếng các DTTS ở ViệtNam nói chung và tiếng Ê Đê nói riêng, mô hình hợp nhất nguồn dữ liệu Việt-Ê Đê và Ê Đê-Việt Ďƣợc Ďề xuất góp phần xây dựng KNV song ngữ Việt-Ê Đê từ nguồn dữ liệu từ Ďiển giấy Việt-Ê Đê và Ê Đê-Việt. Mô hình hợp nhất nguồn dữ liệu Ďƣợc Ďề xuất, có thể Ďƣợc mở rộng Ďể giải quyết bài toán xây dựng KNV song ngữ Việt-DTTS khác ở Việt Nam. 3.2. Xây dựng kho ngữ vựng song ngữ Việt-Ê Đê 3.2.1. Tổ chức kho ngữ vựng song ngữ Việt-Ê Đê a) Tiêu chí dữ liệu Với mục tiêu, xây dựng KNVV-E và Ê Đê-Việt làm hạ tầng cơ sở cho môi trƣờng xử lý tiếng Ê Đê. Các tiêu chí dữ liệu Ďƣợc Ďặt ra trong KNV nhƣ sau: Các từ tiếng Ê Đê Ďƣợc thu thập và ghi theo tiếng Ê Đê nhóm Kpă. Các từ tiếng Việt là từ tiếng Việt phổ thông ghi bằng chữ Quốc ngữ. Các ví dụ Ďƣợc Ďƣa vào Ďể làm sáng tỏ cho nghĩa và cách sử dụng của từ ngữ hay còn gọi là ngữ cảnh của mục từ. Các mục từ Ďƣợc gán nhãn từ loại: gán nhãn N cho danh từ, gán nhãn V cho Ďộng từ, gán nhãn A cho tính từ, gán nhãn O cho các mục từ không phải là danh từ, Ďộng từ hay tính từ. Từ Ďa nghĩa Ďƣợc ghi nhận, dịch và Ďối chiếu với các từ khác nhau tƣơng Ďƣơng trong ngôn ngữ Ďích. Khi gióng hàng từ của ngôn ngữ nguồn, tìm từ tƣơng Ďƣơng trong ngôn ngữ Ďích, trên cơ sở nghĩa cơ bản, nghĩa thƣờng dùng hiện nay ở cả hai ngôn ngữ. Dữ liệu Ďƣợc lƣu trên máy với phông chữ Unicode. Đây là tiêu chí mà các kết quả nghiên cứu KNVV-E từ trƣớc Ďến nay chƣa Ďề cập Ďến. b) Nguồn dữ liệu Nguồn dữ liệu từ Ďiển giấy song ngữ Việt-Ê Đê và Ê Đê-Việt Ďƣợc chọn làm dữ liệu Ďầu vào cho mô hình tƣơng tác: Hình 3.1. Mô hình hợp nhất nguồn dữ liệu song ngữ

18. 15 Từ Ďiển Việt-Ê Đê, gồm 10.000 Ďơn vị mục từ, phần lớn thuộc vốn từ cơ bản, thông dụng của tiếng Việt. Từ Ďiển, Ďƣợc nhập thủ công trên hệ STVB. Từ Ďiển Ê Đê-Việt, có khoảng 10.000 mục từ. Phần lớn các từ ngữ thƣờng dùng hàng ngày của tiếng Ê Đê. Cũng giống nhƣ từ Ďiển Việt-Ê Đê, từ Ďiển này cũng Ďƣợc nhập thủ công trên hệ STVB Winword. KNV tiếng Việt, có trên 31.000 mục từ, kế thừa từ “Đề tài VLSP”. c) Cấu trúc kho ngữ vựng Tổ chức cấu trúc KNV là bƣớc quan trọng trong xây dựng KNV. Trong luận án, KNV Ďƣợc thiết kế theo mô hình CSDL quan hệ. CSDL quan hệ Ďƣợc sử dụng nhƣ một tập hợp các bảng lƣu trữ dữ liệu và lƣu trữ một tập hợp các thực thể có quan hệ với nhau. Các bảng CSDL tƣơng tự nhƣ một KNV, Ďƣợc lƣu trữ hoàn toàn Ďộc lập về cấu trúc cũng nhƣ về dữ liệu. 3.2.2. Cập nhật dữ liệu vào kho ngữ vựng song ngữ Việt-Ê Đê Trong KNVV-E, các mục từ Ďƣợc cập nhập thông qua thông qua bộ công cụ thực hiện hợp nhất nguồn dữ liệu song ngữ, Ďƣợc luận án Ďề xuất xây dựng và Ďƣợc Ďặt tên MEDAS (MErging DAta Sources). Công cụ MEDAS gồm hai chức năng thực hiện hai mô Ďun tƣơng tác Việt-Ê Đê và Ê Đê-Việt trong môi trƣờng hợp nhất của mô hình hợp nhất nguồn dữ liệu song ngữ Ďã Ďƣợc Ďề xuất trong Mục 3.1. Kết quả các mục từ nhập vào trong các kho ngữ vựng, Ďƣợc thống kê trong Bảng 3.6. Bảng 3.6. Thống kê số mục từ được nhập vào trong các kho ngữ vựng Kho ngữ vựng Số mục từ đƣợc cập nhật Tổng cộngMô đun tƣơng tác Ê Đê-Việt Mô đun tƣơng tác Việt-Ê Đê Tiếng Việt 11.357 2.575 13.932 Tiếng Ê Đê 9.287 2.149 11.436 Việt-Ê Đê 17.980 3.167 21.147 3.2.3. Đánh giá kho ngữ vựng song ngữ Việt-Ê Đê Sau khi xây dựng KNVV-E, trong luận án cần Ďánh giá Ďộ bao phủ của KNV trên các văn bản tiếng Việt và tiếng Ê Đê. Chúng tôi Ďề xuất Ďộ bao phủ trong KNV là DC (Degree of Coverage). DC tính Ďộ bao phủ của các mục từ trong KNV trên các văn bản, Ďƣợc hình thành nhƣ là một tỷ lệ phần trăm tổng số các từ KNV bao phủ trên văn bản. Trong đó: X: tổng số từ trong văn bản, Y: tổng số từ trong văn bản chƣa có trong KNV, Y ≤ X a) Tính độ bao phủ các mục từ tiếng Ê Đê Để kiểm tra các từ trong văn bản tiếng Ê Đê có hay chƣa có trong KNV, 100   X YX DC

19. 16 công cụ tách từ Ďƣợc xây dựng từ Ďể tách các từ Ê Đê trong văn bản. Hƣớng tiếp cận cho bài toán tách từ là hƣớng tiếp cận dựa trên KNV. Để tách các từ không có trong KNV, phƣơng pháp tách từ Ďƣợc áp dụng là phƣơng pháp so khớp cực Ďại dựa vào các mục từ trong KNV. Độ bao phủ KNV Ê Đê trên các văn bản tiếng Ê Đê tính Ďƣợc trong bảng 3.10. Bảng 3.10. Độ bao phủ KNV Ê Đê trên các văn bản tiếng Ê Đê Loại văn bản Số từ tách đƣợc Số từ chƣa có trong KNV Độ bao phủ Sách học tiếng Ê Đê 1.815 96 94,71% Truyện Ďọc Ê Đê-Việt 2.052 276 86,55% Bản tin tiếng Ê Đê 3.725 328 91,19% Độ bao phủ trung bình 90,82% b) Tính độ bao phủ mục từ tiếng Việt Để kiểm tra các từ trong các văn bản tiếng Việt có hay chƣa có trong KNV, phƣơng pháp tách từ tiếng Việt Ďƣợc kế thừa từ bộ công cụ tách từ vnTokenizer sau khi Ďã bổ sung các từ tiếng Việt Ďã phát hiện chƣa có trong KVN tiếng Việt vào kho từ vựng mở rộng của vnTokenizer. Sau Ďó, kiểm tra các từ tách Ďƣợc trong KNVV-E. Độ bao phủ KNV tiếng Việt trên các văn bản tiếng Việt tính Ďƣợc trong Bảng 3.12. Bảng 3.12. Độ bao phủ KNV trên các văn bản tiếng Việt Loại văn bản Số từ tách đƣợc Số từ chƣa có trong KNV Độ bao phủ Sách học tiếng Việt 3, 4, 5 3.324 225 93,23% Truyện Ďọc tiếng Việt 3, 4, 5 3.538 274 92,26% Bản tin sở giáo dục Đăk Lăk 4.777 509 89,34% Độ bao phủ trung bình 91,61% Kết quả tính Ďộ bao phủ của KNVV-E trên các văn bản tiếng Việt là 91,61% tính Ďƣợc trong Bảng 3.12 và trên các văn bản tiếng Ê Đê là 90,82% tính Ďƣợc trong Bảng 3.10, phần nào Ďã chứng minh Ďƣợc tính khả thi của KNVV-E trong việc triển khai các ứng dụng xử lý tiếng Ê Đê trong dạy và học tiếng Ê Đê. 3.3. Quản lý kho ngữ vựng song ngữ Việt-Ê Đê 3.3.1. Phát triển kho ngữ vựng song ngữ Việt-Ê Đê Trong kho ngữ vựng việc bổ sung thêm các mục từ mới và cập nhật các thành phần ngữ nghĩa, từ loại, ví dụ làm rõ nghĩa của các mục từ là công việc không thể không Ďề cập Ďến trong việc phát triển kho ngữ vựng.

20. 17 Chức năng Cập nhật mục từ trong trang web cho phép bổ sung mục từ mới vào kho ngữ vựng theo mô hình hợp nhất nguồn dữ liệu song ngữ và chỉnh sửa các thành phần của các mục từ Ďã có trong kho ngữ vựng. Chức năng này Ďƣợc thực hiện bởi nhà các khoa học hay các chuyên gia ngôn ngữ tiếng Ê Đê. 3.3.2. Nâng cao chất lượng kho ngữ vựng Nhằm góp phần trong việc nâng cao chất lƣợng KNV Việt-Ê Đê, giải pháp kiểm tra chính tả âm tiết tiếng Ê Đê Ďƣợc áp dụng Ďể xây dựng bộ kiểm tra lỗi chính tả âm tiết các mục từ tiếng Ê Đê trong KNV, Ďƣợc Ďặt tên CESILD (Checking Ede Sylable In Lexical Database). Hoạt Ďộng bộ CESILD thể hiện trong Hình 3.2. 3.3.3. Định hướng khai thác kho ngữ vựng song ngữ Việt-Ê Đê Nhằm tạo Ďiều kiện thuận lợi cho học sinh dân tộc Ê Đê và giáo viên trong dạy và học tiếng Ê Đê, trên cơ sở khai thác KNVV-E qua môi trƣờng xử lý tiếng Ê Đê, các ứng dụng Ďƣợc triển khai: – Tra cứu trực tuyến từ vựng Việt-Ê Đê, – Tra cứu ngoại tuyến từ vựng Việt-Ê Đê, – Kiểm tra chính tả văn bản tiếng Ê Đê, – Trợ giúp dịch máy Việt-Ê Đê, Thông qua môi trƣờng xử lý tiếng Ê Đê không chỉ triển khai các ứng dụng khai thác KNVV-E, mà còn góp phần quản lý việc cập nhật các mục từ trong KNV song ngữ Ê Đê-Việt và chia sẻ KNV cho các hoạt Ďộng nghiên cứu xử lý tiếng Ê Đê. 3.4. Kết luận chƣơng 3 Những kết quả Ďạt Ďƣợc trong chƣơng này là cơ sở Ďể luận án tiếp tục triển khai một số ứng dụng xử lý tiếng Ê Đê trong dạy và học tiếng Ê Đê. CHƢƠNG 4 XÂY DỰNG ỨNG DỤNG XỬ LÝ TIẾNG Ê ĐÊ 4.1. Dạy và học tiếng Ê Đê 4.1.1. Thực trạng dạy và học tiếng Ê Đê Dạy và học tiếng Ê Đê cho Ďến nay vẫn còn những khó khăn: Số lƣợng giáo viên dạy tiếng Ê Đê vẫn còn thiếu so với nhu cầu. Chất lƣợng giảng dạy tiếng Ê Đê vẫn còn hạn chế do cơ sở vật chất, thiết bị, Ďồ dùng dạy học, tài liệu sách tham khảo phục vụ cho việc dạy và học tiếng Ê Đê vẫn còn thiếu. Hình 3.2. Mô hình hoạt động của bộ CESILD

21. 18 Soạn thảo văn bản tiếng Ê Đê với phông chữ tiếng Ê Đê có nhiều chữ cái Ê Đê rất khó gõ và khó nhớ, dễ gây lỗi chính tả. Trao Ďổi các tài liệu tiếng Ê Đê Ďều bị hạn chế về vấn Ďề hiển thị chữ viết tiếng Ê Đê trên các máy tính không cài phông chữ tiếng Ê Đê. Chƣa có các ứng dụng Công nghệ Thông tin trợ giúp trong cho giáo viên và học sinh dân tộc Ê Đê trong dạy và học tiếng Ê Đê. 4.1.2. Giải pháp sử dụng môi trường xử lý tiếng Ê Đê Để ứng dụng Công nghệ Thông tin vào trong dạy và học tiếng Ê Đê cần có sự nỗ lực của các chuyên gia Công nghệ Thông tin trong việc Ďầu tƣ phát triển cơ sở hạ tầng cho xử lý tiếng Ê Đê và xây dựng các ứng dụng trợ giúp trong dạy và học tiếng Ê Đê. Giải pháp xây dựng một môi trƣờng xử lý tiếng Ê Đê Ďƣợc Ďặt ra trong Luận án là giải pháp thiết thực. Thông qua môi trƣờng này, các chuyên gia ngôn ngữ Ê Đê có Ďƣợc môi trƣờng Ďể cùng tham gia Ďóng góp, cập nhật dữ liệu vào kho ngữ vựng, góp phần nâng cao chất lƣợng kho ngữ vựng Việt- Ê Đê. Kho ngữ vựng Việt-Ê Đê, các công cụ kỹ thuật, các kết quả nghiên cứu cũng Ďƣợc chia sẻ cho các hoạt Ďộng nghiên cứu xử lý tiếng Ê Đê và ngƣời dùng. Các triển khai xây dựng ứng dụng xử lý tiếng Ê Đê trong dạy và học tiếng Ê Đê với nguồn dữ liệu là kho ngữ vựng Việt-Ê Đê cũng Ďƣợc download từ môi trƣờng này. 4.1.3. Các ứng dụng dạy và học tiếng Ê Đê Cùng với phƣơng pháp dạy học, cơ sở vật chất, sách giáo khoa chuẩn, ứng dụng Công nghệ Thông tin cũng là phƣơng tiện góp phần nâng cao chất lƣợng dạy và học tiếng Ê Đê. Nhằm tạo Ďiều kiện thuận lợi cho giáo viên và học sinh dân tộc Ê Đê trong việc dạy và học tiếng Ê Đê, Luận án Ďã Ďề xuất triển khai xây dựng một số ứng dụng xử lý tiếng Ê Đê trong dạy và học tiếng Ê Đê, cụ thể: Ứng dụng tra cứu trực tuyến và ngoại tuyến từ vựng song ngữ Việt-Ê Đê, góp phần giúp học sinh, giáo viên trong việc tra cứu từ vựng, tìm hiểu từ loại và ý nghĩa của từ thông qua các ví dụ Ďƣợc hiển thị. Ứng dụng tra từ vựng Việt-Ê Đê ngoại tuyến có thể Ďƣợc triển khai nhƣ một giáo cụ trực quan dùng trong giảng dạy môn học tiếng Ê Đê. Ứng dụng kiểm tra lỗi chính tả văn bản tiếng Ê Đê, góp phần giúp cho giáo viên, học sinh phát hiện và sửa các lỗi chính tả âm tiết trên các văn bản Ďƣợc soạn thảo bằng tiếng Ê Đê nhƣ các giáo trình, giáo án, bài học, bài tập… Ứng dụng trợ giúp dịch máy Việt-Ê Đê, góp phần hỗ trợ việc dịch máy các bài học từ tiếng Việt sang tiếng Ê Đê, tạo Ďiều kiện Ďể tiếp tục nâng cấp trình Ďộ giảng dạy tiếng Ê Đê, giúp giáo viên trong việc biên soạn giáo án song ngữ Việt-Ê Đê, góp phần làm phong phú các môn học song ngữ Việt- Ê Đê. 4.2. Tra cứu từ vựng song ngữ Việt-Ê Đê 4.2.1. Vai trò của từ vựng trong dạy và học song ngữ Việt-Ê Đê Học từ vựng và rèn luyện kĩ năng sử dụng từ vựng là yếu tố Ďầu tiên trong dạy và học một ngôn ngữ nói chung và dạy tiếng Ê Đê nói riêng.

22. 19 Do tầm quan trọng của từ vựng Ďối với ngƣời học tiếng Ê Đê, vì vậy, giáo viên giảng dạy tiếng Ê Đê cần phải phát triển từ vựng cho học sinh, cũng nhƣ giúp học sinh phát triển khả năng giao tiếp sử dụng vốn từ vựng Ďã Ďƣợc học. Trên cơ sở tầm quan trọng của từ vựng trong dạy và học tiếng Ê Đê, ứng dụng tra cứu từ vựng Việt-Ê Đê là cần thiết cho giáo viên giảng dạy tiếng Ê Đê và học sinh học tiếng Ê Đê. 4.2.2. Xây dựng ứng dụng tra cứu từ vựng song ngữ Việt-Ê Đê Những mặt hạn chế cần Ďƣợc khắc phục trong xây dựng ứng dụng tra cứu từ vựng Việt-DTTS: Chƣa dùng phông chữ Unicode trong hiển thị chữ viết tiếng DTTS. Chƣa dùng chung KNV nhƣ là hạ tầng cơ sở cho bài toán xử lý tiếng DTTS. Để khắc phục những hạn chế trên, kết quả của giải pháp Unicode cho STVB tiếng Ê Đê và KNVV-E trong luận án, Ďƣợc sử dụng trong xây dựng ứng tra cứu từ vựng Việt-Ê Đê. a) Ứng dụng tra cứu từ vựng Việt-Ê Đê Hoạt Ďộng theo sơ Ďồ trong hình 4.1. b) Ứng dụng tra cứu từ vựng Ê Đê-Việt Hoạt Ďộng theo sơ Ďồ trong hình 4.2. 4.2.3. Ứng dụng tra cứu từ vựng song ngữ Việt-Ê Đê Ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê Ďƣợc triển khai trên trang Web quản lý kho ngữ vựng. Chức năng Tra cứu từ vựng Ďƣợc xây dựng dựa trên sơ Ďồ hoạt Ďộng tra cứu từ vựng Việt-Ê Đê (Hình 4.1) và tra cứu từ vựng Ê Đê-Việt (Hình 4.2). Hình 4.1. Sơ đồ hoạt động tra cứu từ vựng Việt-Ê Đê Hình 4.2. Sơ đồ hoạt động tra cứu từ vựng Ê Đê-Việt

23. 20 Ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê, góp phần giúp giáo viên và học sinh trong việc tra cứu và học từ vựng. Tuy nhiên, trong ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê vẫn có những mặt thuận lợi và khó khăn: Thuận lợi: ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê không cần cài Ďặt, tất cả mọi ngƣời Ďều có thể sử dụng, cho phép ngƣời dùng truy cập mọi lúc, mọi nơi và thƣờng xuyên Ďƣợc cập nhật mục từ mới. Khó khăn: không phải lúc nào ngƣời dùng cũng có thể vào internet Ďể tra cứu từ vựng. Để khắc phục khó khăn của ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê, luận án Ďề xuất xây dựng ứng dụng tra cứu ngoại tuyến từ vựng song ngữ Việt-Ê Đê. 4.2.3.1. Tra cứu ngoại tuyến từ vựng song ngữ Việt-Ê Đê Chức năng hiển thị kết quả tra cứu từ vựng Ďƣợc xây dựng dựa theo sơ Ďồ hoạt Ďộng tra cứu từ vựng Việt-Ê Đê (Hình 4.1) và tra cứu từ vựng Ê Đê- Việt (Hình 4.2). Ngoài chức năng trợ giúp tra cứu từ vựng và khắc phục những mặt hạn chế của ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê, ứng dụng tra cứu ngoại tuyến từ vựng song ngữ Việt-Ê Đê còn Ďƣợc dùng nhƣ một giáo cụ trực quan dùng trong giảng dạy môn học tiếng Ê Đê. 4.3. Trợ giúp dịch máy Việt-Ê Đê 4.3.1. Dịch máy văn bản Việt-Ê Đê trong dạy và học Để ứng dụng bài toán dịch máy văn bản tiếng Việt sang tiếng Ê Đê vào dịch các bài học từ tiếng Việt sang tiếng Ê Đê và giải quyết Ďƣợc các trƣờng hợp nhập nhằng trong quá trình dịch. Luận án Ďề xuất, xây dựng ứng dụng trợ giúp dịch máy Việt-Ê Đê. Ứng dụng trợ giúp chính là tích hợp Ďƣợc sự trợ giúp của NSD trong việc xử lý các trƣờng hợp nhập nhằng trong từ vựng tiếng Ê Đê. Ứng dụng này góp phần trợ giúp việc dịch máy các bài học tiếng Việt trong sách giáo khoa sang tiếng Ê Đê, nhằm tạo Ďiều kiện Ďể tiếp tục nâng cấp trình Ďộ dạy tiếng Ê Đê, giúp giáo viên trong việc biên soạn giáo án song ngữ Việt-Ê Đê và góp phần làm phong phú trong học song ngữ Việt-Ê Đê qua các môn học nhƣ toán, khoa học, lịch sử, Ďịa lý… không phải chỉ có học môn tiếng Ê Đê nhƣ hiện nay. 4.3.2. Giải quyết bài toán tách từ tiếng Việt trong dịch máy Việt-Ê Đê Trong khuôn khổ của luận án, không Ďi sâu vào nghiên cứu bài toán tách từ, mà kế thừa bộ công cụ tách từ tiếng Việt vnTokenizer Ďã Ďƣợc công bố và chia sẻ của “Đề tài VLSP”. Để vnTokenizer tách từ tiếng Việt tƣơng ứng với từ tiếng Ê Đê, thì các mục từ tiếng Việt Ďƣợc ghi chú bổ sung trong KNV tiếng Việt phải Ďƣợc bổ sung vào trong KNV mở rộng của vnTokenizer là rất cần thiết cho việc tách từ trong hệ dịch Việt-Ê Đê. 4.3.3. Xây dựng ứng dụng trợ giúp dịch máy Việt-Ê Đê 4.3.3.1. Phương pháp dịch Phƣơng pháp Ďƣợc chọn trong ứng dụng trợ giúp dịch máy Việt-Ê Đê là

24. 21 phƣơng pháp dịch dựa vào KNVV-E Ďã Ďƣợc xây dựng. Phƣơng pháp dịch này phụ thuộc hoàn toàn vào KNVV-E và gần nhƣ Ďây là kiểu dịch trực tiếp bằng cách thay thế theo kiểu 1-1. Tuy nhiên, chỉ áp dụng phƣơng pháp này cho bộ dịch máy Việt-Ê Đê, thì vẫn chƣa xử lý Ďƣợc các trƣờng hợp nhập nhằng ranh giới từ, nhập nhằng từ Ďa nghĩa, nhập nhằng từ Ďồng âm, nhập nhằng từ loại và chƣa xử lý Ďƣợc các từ không có trong KNV. Vì vậy, kết quả các bản dịch Việt-Ê Đê chƣa thể Ďƣa ứng dụng trong dạy và học tiếng Ê Đê. Để kết quả các bản dịch Việt-Ê Đê có thể Ďƣợc Ďƣa vào ứng dụng trong dạy và học tiếng Ê Đê, luận án Ďề xuất xây dựng ứng dụng trợ giúp dịch máy Việt-Ê Đê. Để làm Ďƣợc công việc này, trong ứng dụng trợ giúp dịch máy Việt-Ê Đê cần phải tích hợp Ďƣợc sự trợ giúp của NSD, Ďể xác Ďịnh từ thích hợp cho các trƣờng hợp nhập nhằng và các từ không có trong KNV. 4.3.3.2. Bộ ứng dụng trợ giúp dịch máy Việt-Ê Đê Trên cơ sở Ďã xác Ďịnh phƣơng pháp dịch cho hệ dịch và phƣơng pháp tách từ ứng với phƣơng pháp dịch, bộ hỗ trợ dịch máy Việt-Ê Đê Ďƣợc Ďề xuất. Hoạt Ďộng của bộ hỗ trợ dịch máy Việt-Ê Đê, trình bày trong hình 4.3 4.3.3.3. Kết quả thực nghiệm Bộ ứng dụng trợ giúp dịch máy Việt-Ê Đê Ďã xử lý Ďƣợc trật tự của các câu hỏi với các từ Ďể hỏi Ďƣợc Ďƣa vào hệ thống dịch. Bộ ứng dụng trợ giúp dịch máy Việt-Ê Đê Ďã xử lý Ďƣợc trên 90% trật tự từ Ďể hỏi trong 303 tổng số câu nghi vấn. Còn khoảng 10% các từ Ďể hỏi chƣa xử lý, cũng Ďã Ďƣợc kiểm tra sau mỗi lần dịch và nhận thấy các từ này do không có dấu kết thúc câu Ďứng trƣớc câu hỏi. Từ kết quả kiểm chứng, cho thấy rằng, những từ Ďể hỏi không xử lý Ďƣợc là do NSD nhập sai, không phải là do hệ thống. Do Ďó, luận án cũng có cơ sở Ďể khẳng Ďịnh mô Ďun xử lý trật tự các từ dùng Ďể hỏi trong văn bản tiếng Hình 4.3. Hoạt động của bộ ứng dụng trợ giúp dịch máy Việt-Ê Đê

26. 23 liệu thử nghiệm ban Ďầu Ďƣợc tiến hành trên sách học tiếng Ê Đê, truyện Ďọc Ê Đê-Việt, báo dân tộc và miền núi. Tập văn bản thử nghiệm gồm 30 văn bản với số lỗi chính tả ngẫu nhiên Ďã Ďƣợc xác Ďịnh, có tất cả 150 lỗi chính tả ở mức âm tiết. Kết quả thử nghiệm, bộ SCET Ďã phát hiện Ďƣợc 142 lỗi chính tả âm tiết sai Ďƣợc Ďƣa vào. Còn 8 âm tiết sai không phát hiện Ďƣợc một phần là do có sự nhập nhằng giữa phần Ďầu của âm tiết với âm chính và âm cuối. Bảng 4.3 mô tả kết quả thử nghiệm phát hiện lỗi chính tả trong các văn bản với số lỗi chính tả ngẫu nhiên Ďã Ďƣợc xác Ďịnh. Bảng 4.3. Kết quả thử nghiệm với số lỗi chính tả ngẫu nhiên đã được xác định Số âm tiết Lỗi phát hiện đƣợc Lỗi không phát hiện đƣợc Tỷ lệ không phát hiện đƣợc 150 142 8 5,7% Qua kết quả thử nghiệm thu Ďƣợc, cho thấy khả năng phát hiện lỗi chính tả âm tiết tiếng Ê Đê của giải pháp Ďạt Ďƣợc là 94,3%. Giải pháp này Ďã góp phần phát hiện lỗi chính tả âm tiết trong văn bản tiếng Ê Đê. b) Đánh giá kết quả thử nghiệm Khả năng phát hiện lỗi chính tả âm tiết tiếng Ê Đê của giải pháp Ďạt Ďƣợc trên 94% (bảng 4.4). Kết quả này phụ thuộc vào ngữ liệu Ďầu vào cho quá trình tiền xử lý văn bản nhƣ từ Ďiển tên riêng, từ Ďiển viết tắt… Quá trình tiền xử lý văn bản cần sử dụng các ngữ liệu này Ďể phân loại âm tiết và lọc nhiễu trƣớc khi thực hiện kiểm tra chính tả âm tiết. Với ngữ liệu Ďầu vào Ďầy Ďủ, hiệu suất khả năng phát hiện lỗi chính tả âm tiết tiếng Ê Đê Ďƣợc nâng cao. Bộ SCET Ďã góp phần trợ giúp cho giáo viên, học sinh phát hiện và sửa các lỗi chính tả âm tiết trên các văn bản soạn thảo bằng tiếng Ê Đê nhƣ các giáo trình, giáo án, các bài học, bài tập… 4.5. Kết luận chƣơng 4 Những kết quả Ďã Ďạt Ďƣợc trong chƣơng này, Ďã góp phần khắc phục Ďƣợc những thực trạng về xử lý tiếng các DTTS ở Việt Nam nói chung và tiếng Ê Đê nói riêng, thông qua việc triển khai các ứng dụng trong dạy và học tiếng Ê Đê. KẾT LUẬN 1. Các kết quả chính của luận án Những nghiên cứu và giải pháp Ďƣợc Ďề cập ở trên Ďã góp phần: 1) Xây dựng môi trƣờng xử lý tiếng Ê Đê, nhằm Ďịnh hƣớng qui trình nghiên cứu trong xử lý tiếng Ê Đê. 2) Sử dụng Unicode cho STVB tiếng DTTS nói chung và tiếng Ê Đê nói riêng. 3) Xây dựng KNV V-E dựa trên mô hình hợp nhất nguồn dữ liệu song ngữ Việt-Ê Đê và Ê Đê-Việt Ê Đê. 4) Đề xuất mô hình kiểm tra lỗi chính tả âm tiết dựa trên mô hình âm tiết

27. 24 tiếng Ê Đê, góp phần phát hiện lỗi chính tả âm tiết trong văn bản tiếng Ê Đê, kiểm tra các âm tiết tiếng Ê Đê trong KNVV-E. 5) Triển khai các ứng dụng trong dạy và học tiếng Ê Đê. 2. Đánh giá kết quả Kết quả Ďạt Ďƣợc sau Ďây là chƣa Ďƣợc nghiên cứu từ trƣớc Ďến nay: Định hƣớng qui trình nghiên cứu trong xử lý tiếng các DTTS ở Việt Nam nói chung và xử lý tiếng Ê Đê nói riêng. Sử dụng Unicode trong STVB tiếng Ê Đê, góp phần ứng dụng STVB tiếng Ê Đê trong môi trƣờng Ďa ngữ. Chuyển Ďổi các văn bản tiếng Ê Đê dùng phông chữ riêng sang Unicode, góp phần giải quyết khó khăn trong việc trao Ďổi, sử dụng các văn bản chữ viết tiếng DTTS không sử dụng phông chữ Unicode. Kiểm tra Ďƣợc lỗi chính tả âm tiết trong văn bản tiếng Ê Đê, góp phần phát hiện lỗi chính tả trong STVB tiếng Ê Đê. Xây dựng KNVV-E với các tiêu chí: thống nhất dùng phông chữ Unicode, phát hiện từ tiếng Việt tƣơng ứng với tiếng Ê Đê không có trong KNV tiếng Việt, các mục từ Ê Đê trong KNV Ďã Ďƣợc kiểm tra lỗi chính tả âm tiết và chia sẻ KNV cho các hoạt Ďộng nghiên cứu, góp phần xây dựng hạ tầng cơ sở cho môi trƣờng xử lý tiếng Ê Đê. Triển khai một số ứng dụng xử lý tiếng Ê Đê trong dạy và học tiếng Ê Đê, góp phần ứng dụng CNTT trong việc nâng cao chất lƣợng dạy và học tiếng Ê Đê. 3. Hướng phát triển Ngoài các kết quả Ďã Ďạt Ďƣợc trong luận án, một số vấn Ďề nảy sinh từ luận án cần Ďƣợc tiếp tục hoàn thiện trong tƣơng lai là nhƣ sau: Hoàn thiện những kết quả đã có Nội dung nghiên cứu của luận án chỉ mới kiểm tra Ďƣợc lỗi chính tả tiếng Ê Đê ở mức âm tiết, bài toán kiểm tra lỗi chính tả tiếng Ê Đê sẽ Ďƣợc nghiên cứu tiếp tục ở các mức tiếp theo, Kiểm tra lỗi chính tả tiếng Ê Đê và tiếng Việt trong KNV Tiếp tục Nâng cao chất lƣợng KNVV-E với sự trợ giúp của chuyên gia ngôn ngữ tiếng Ê Đê qua môi trƣờng xử lý tiếng Ê Đê, Mở rộng xử lý Ďa ngữ cho các ngôn ngữ DTTS khác, Tiếp tục các chủ Ďề xử tiếng Ê Đê theo Ďịnh hƣớng XLNNTN.

Hiệu Quả Từ Chương Trình Dạy Tiếng Ê Đê Trong Trường Học

(GD&TĐ) – Tại tỉnh Đắk Nông, đồng bào dân tộc Êđê sống tập trung chủ yếu ở huyện Chư Jút. Vì vậy, nhiều trường học gần 100% học sinh là con em đồng bào Êđê

Để giúp học sinh biết cách gìn giữ những bản sắc văn hóa riêng của dân tộc mình, đặc biệt là chữ viết, Sở Giáo dục và Đào tạo đã quyết định đưa việc dạy tiếng Êđê vào dạy ở các trường học như một môn học chính thức. Qua nhiều năm giảng dạy đã phần nào cho thấy được tầm quan trọng cũng như ý nghĩa của môn học này trong việc giáo dục học sinh.

HS trường Tiểu học Y Jút trong giờ học tiếng Ê Đê

Tại Trường Tiểu học Y Jút, trong tiết dạy tiếng Êđê, không khí học tập của các em học sinh lớp 5A rất sôi nổi, ai nấy đều trở nên mạnh dạn hơn. Theo cô giáo HĐớk – người đã gắn bó với lớp nhiều năm nay và cũng là người duy nhất đảm nhiệm vai trò dạy tiếng Êđê cho học sinh trong trường thì qua 3 năm học, đến nay các em trong lớp đã biết viết và biết làm những bài tập làm văn bằng tiếng mẹ đẻ của mình. Điều mà trước đây các em chỉ phát âm được mà không hề biết đến mặt chữ là thế nào. Từ năm 2006, nhà trường đã đưa chương trình dạy tiếng Êđê vào giảng dạy ở 3 khối lớp 3, 4 và khối lớp 5. Bình quân mỗi tuần các em được học một tiết.

Theo đánh giá của nhiều giáo viên thì môn học này đã thật sự lôi cuốn học sinh và là tiết học mong đợi của các em mỗi tuần. Cô giáo HĐớk cho biết: “Hình thức dạy môn học này cũng tương tự như dạy môn Tiếng Việt cho các em. Nội dung học bao gồm các phần như: học âm vần, luyện từ và câu, viết chính tả, làm văn. Vì các em chỉ biết nói mà không biết viết nên đây cũng có thể coi như một môn “ngoại ngữ”.

Chính vì vậy, việc dạy chữ bước đầu cũng gặp rất nhiều khó khăn, nhiều em hay lẫn lộn giữa chữ viết tiếng mẹ đẻ với tiếng phổ thông, phải mất rất nhiều thời gian để chỉnh sửa và giúp các em biết cách phân biệt. Có lẽ do được giao tiếp bằng ngôn ngữ quen thuộc nên các em cảm thấy gần gũi, rất mạnh dạn và chủ động trong giờ học. Tỷ lệ học sinh học môn học này hàng năm đạt loại khá, giỏi tương đối cao”. Không những vậy, việc học tiếng mẹ đẻ đã hỗ trợ đắc lực cho các em trong việc học tập các môn học khác, đặc biệt là môn tiếng Việt.

Thông qua môn học tiếng Êđê, các em có thể hiểu sâu sắc hơn nội dung bài học của các môn học khác. Nhiều khi giáo viên giảng bài bằng tiếng Việt, nhiều em không kịp hiểu, nhưng nếu giảng bằng tiếng mẹ đẻ thì vấn đề sẽ đơn giản hơn. Đây cũng là cách mà giáo viên dạy tiếng Êđê và các giáo viên bộ môn khác thường hỗ trợ nhau trong quá trình giảng dạy.

Để khuyến khích và động viên học sinh, kết thúc mỗi học kỳ, nhà trường luôn có những hình thức khen ngợi và trao phần thưởng cho những em học giỏi môn học này. Vì thế, môn học tiếng Êđê ngày càng thu hút được sự quan tâm của các em.

Cô giáo Hà Thị Kim Anh, Phó hiệu trưởng Trường Tiểu học Y Jút cho biết: “Việc dạy tiếng mẹ đẻ cho các em không chỉ hỗ trợ đắc lực cho việc dạy các môn học khác, mà còn hạn chế được tối đa tình trạng bất đồng ngôn ngữ giữa cô và trò, cũng như hiện tượng bỏ học của nhiều học sinh. Thông qua môn học này còn giúp các em biết quý trọng và có ý thức lưu giữ chữ viết của ông cha mình cũng như những giá trị văn hóa khác của dân tộc”.

Tại Trường Tiểu học Hà Huy Tập, theo cô giáo HGen – người đảm nhiệm dạy bộ môn tiếng Êđê. Theo thì bên cạnh việc dạy chữ viết, giáo viên còn có điều kiện lồng ghép tuyên truyền những bản sắc văn hóa tốt đẹp của đồng bào Ê Đê, giúp các em hiểu được đâu là những giá trị cần phải lưu giữ, đâu là những hủ tục cần phải loại bỏ. Việc dạy tiếng mẹ đẻ cũng là một trong những hình thức giúp các em phát huy được tính tích cực, chủ động trong học tập. Qua mỗi tiết dạy tiếng Êđê, các em đều trở nên mạnh dạn và hăng say phát biểu, bày tỏ ý kiến của mình hơn, dần hình thành thói quen tốt ở các môn học khác.

Theo ông Nguyễn Ngọc Thạch, Trưởng Phòng Giáo dụcvà Đào tạo huyện Chư Jút thì việc dạy tiếng Êđê mang lại rất nhiều ý nghĩa thiết thực. Tuy nhiên, hiện nay toàn huyện chỉ có hai giáo viên được đào tạo chuyên môn nên mới triển khai được ở hai trường tiểu học có đông học sinh dân tộc Êđê nhất là hai trường Hà Huy Tập và Y Jút. Cũng do ít giáo viên nên cơ hội để giao lưu, học hỏi kinh nghiệm rất hạn chế. Thực tế cho thấy, việc dạy tiếng Êđê trong trường học đã phần nào phát huy được vai trò, tác dụng trong việc nâng cao chất lượng học tập cũng như quá trình hình thành nhân cách cho học sinh.

Giáo Dục Tiếng Mẹ Đẻ Trong Trường Tiểu Học Ở Đắc Lắc Và Thái Độ Của Học Sinh Ê Đê

NGÔN NGỮ

SỐ 9

2012

GIÁO DỤC TIẾNG MẸ ĐẺ TRONG TRƯỜNG TIỂU HỌC Ở ĐẮC LẮC VÀ THÁI ĐỘ CỦA HỌC SINH Ê ĐÊ chúng tôi ĐOÀN VĂN PHÚC

1. Mở đầu 1.1. Với việc giáo dục ngôn ngữ trong nhà trường, thì ngôn ngữ có hai chức năng chính: vừa là công cụ lại vừa là đối tượng học tập của học sinh (HS). Hai chức năng này có mối quan hệ qua lại và bổ trợ cho nhau. Đối với học sinh dân tộc thiểu số (HSDTTS) ở Việt Nam, giáo dục ngôn ngữ (và chữ viết) trong nhà trường, một hình thức giáo dục chính quy trong các cơ sở giáo dục công lập, là một hình thức quan trọng để nâng cao trình độ học vấn, trình độ văn hóa cho các em. Tại những nơi có học tiếng mẹ đẻ (TMĐ) trong trường học thì các em HS đồng thời học cả hai thứ tiếng: tiếng phổ thông và TMĐ. Trong trường hợp này, rõ ràng TMĐ đối với HSDTTS chưa phải là công cụ học tập, mà mới chỉ là đối tượng. 1.2. Đảng, Nhà nước và Chính phủ Việt Nam hết sức quan tâm đến công tác dạy tiếng dân tộc thiểu số (DTTS) cho HS. Vì vậy, các cơ quan có thẩm quyền đã có nhiều văn kiện, chỉ thị, nghị quyết, quyết định, cũng như các văn bản quy phạm pháp luật thể hiện sự quan tâm đến bảo tồn, phát huy vai trò, bản sắc ngôn ngữ và văn

hóa các DTTS, trong đó có việc dạy học tiếng nói và chữ viết các dân tộc. 1.3. Vài nét về cư dân Ê đê ở Đắc Lắc Theo Kết quả của cuộc Tổng điều tra dân số và nhà ở năm 2009, người Ê đê hiện có 331.194 người. Họ sống tập trung ở các tỉnh khu vực Tây Nguyên như Đắc Lắc, Đắc Nông và một vài tỉnh vùng duyên hải Trung bộ, như Phú Yên, Khánh Hòa. Từ năm 1976, tỉnh Đắc Lắc của nước Việt Nam thống nhất được hình thành từ hai tỉnh Đắc Lắc (tên cũ trước năm 1975) và Quảng Đức (về cơ bản có cùng địa giới như tỉnh Đắc Nông ngày nay). Nhưng từ năm 2004, Đắc Lắc lại được chia tách trở lại thành tỉnh Đắc Lắc và tỉnh Đắc Nông. Ở Đắc Lắc hiện có cư dân của hơn 40 dân tộc cùng sinh sống và là tỉnh có đông người Ê đê nhất ở Việt Nam (90%). Tại đây, người Ê đê chiếm dân số đông thứ hai trong tỉnh (với 298.534 người), sau người Kinh. Họ sống khá tập trung ở 14/15 huyện, thị xã, thành phố. Đắc Lắc là tỉnh có phong trào dạy – học TMĐ cho HS DTTS tốt nhất ở các tỉnh ở Tây Nguyên. Tiếng Ê đê không chỉ được dạy – học trong

42

Ngôn ngữ số 9 năm 2012

trường tiểu học (TH), mà môn ngữ văn tiếng Ê đê còn được dạy thực nghiệm cho HS trung học cơ sở (THCS) ở các trường phổ thông dân tộc nội trú (PTDTNT). Bài viết sẽ nhìn nhận, tổng kết và đánh giá lại tình hình dạy học tiếng Ê đê cho HS trong trường TH (trước đây và hiện nay), cũng như thái độ của HS Ê đê với môn học TMĐ này. 2. Dạy – học tiếng Ê đê trong trường tiểu học ở Đắc Lắc Trước năm 1975, dưới thời Ngô Đình Diệm, vấn đề dạy tiếng (và chữ) Ê đê trong trường học đã từng bị gạt ra ngoài, song sau đó lại được ngành giáo dục TH của các tỉnh Đắc Lắc, Quảng Đức tổ chức dạy ở một vài trường dân tộc nội trú có HS Ê đê. Từ sau năm 1975 đến nay, việc tổ chức dạy – học tiếng Ê đê trong trường phổ thông ở Đắc Lắc trải qua nhiều thăng trầm, thành công xen lẫn thất bại, và có lúc tưởng chừng như hoàn toàn thất bại. 2.1. Thời kì trước thế kỉ XXI Sau khi miền Nam hoàn toàn được giải phóng, dưới sự chỉ đạo của Ty Giáo dục tỉnh Đắc Lắc, một số cán bộ, trí thức người Ê đê, Gia rai đã chuẩn bị nhiều tư liệu, bài học để phục vụ cho công tác này. Thực hiện Quyết định 53/CP của Chính phủ về chủ trương đối với tiếng nói và chữ viết dân tộc thiểu số, Tỉnh ủy Đắc Lắc đã có Nghị quyết về việc dạy TMĐ cho HS Ê đê trong trường phổ thông. Năm học 1981-1982, ngành giáo dục của tỉnh đã triển khai các hoạt động phục vụ chương trình dạy – học tiếng Ê đê trong trường TH. Một số trường

TH ở thị xã Buôn Ma Thuột, huyện Krông Hnăng, huyện Krông Búc, huyện Krông Ana được chọn thí điểm dạy tiếng Ê đê. Vì là năm học đầu tiên nên tài liệu dạy – học cho giáo viên và học sinh chưa được chuẩn bị đầy đủ. Thực chất tài liệu dạy tiếng Ê đê chỉ được in ronéo và chủ yếu phát cho giáo viên, HS cũng bị thiếu, thậm chí được phát rất ít. Nó gần như được căn ke từ sách tiếng Việt. Đến năm 1983, cuốn sách Tiếng Ê đê Lớp 1 (Klei Êđê Adu sa) lần đầu tiên được xuất bản. Sau đó, nhiều cuốn sách giáo khoa bằng tiếng Ê đê cho HS các lớp 1, 2, 3 cũng đã được triển khai. Việc dạy thí điểm (theo kiểu thực nghiệm) các cuốn sách này ở một số trường TH đã có được những thành công nhất định. Số lượng HS Ê đê đến lớp tăng đáng kể, chất lượng học tiếng Việt được cải thiện rất nhiều so với năm học 1980-1981. Các giáo viên dạy tiếng Ê đê hết sức phấn khởi, hào hứng với việc dạy tiếng – chữ Ê đê trong trường TH. Theo đánh giá của ông Y Luật Niê Ksơr, Giám đốc Trung tâm Phương pháp giáo dục của Sở Giáo dục và Đào tạo Đắc Lắc khi đó (1986) thì chất lượng tiếng Việt của HS TH ở các lớp 1, 2, 3 đã được cải thiện đáng kể. Nếu như trước năm 1981, HS Ê đê có thể đọc, nói tiếng Việt, nhưng chỉ hiểu được hơn 50%, thì những năm 1985 – 1986, các em đã hiểu tiếng Việt được tới 85%. Sau thành công bước đầu ở thời kì dạy thí điểm tại một số trường, vào năm học 1986-1987, Sở GD&ĐT Đắc Lắc đã quyết định triển khai dạy đại trà chương trình song ngữ Ê đê – Việt

41 thuộc Sở GD&ĐT tỉnh, từ năm học 2010-2011 toàn tỉnh đã tổ chức dạy học tiếng Ê đê tăng thêm một huyện (từ 13 huyện của năm học 2010-2011 đã có thêm 01 huyện nữa) tại 14/15 huyện, thị xã, thành phố thuộc tỉnh có đông người Ê đê sinh sống. Từ ba năm trước, số trường TH tham gia tổ chức chương trình dạy – học tiếng Ê đê tăng từ 72 trường với 474 lớp (năm học 2008-2009) thì năm học 2011-2012 đã phát triển thành 84 trường với 527 lớp. Bên cạnh quy mô trường lớp được tăng lên, đội ngũ giáo viên (số lượng, chất lượng), cơ sở vật chất (trường sở, sách giáo khoa). Trong hơn chục năm trở lại đây, Ban biên soạn dân tộc thuộc Sở GD& ĐT được đổi tên thành BNCGDDT. Các loại sách phục vụ cho việc dạy học tiếng Ê đê đã được các cán bộ ở đây biên soạn tốt hơn nhiều. Từ những cuốn sách giáo khoa (được xuất bản đầu tiên năm 1983) đã dần dần được bổ sung, sửa chữa để nâng cao chất lượng. Đó là: Klei Ê đê Hdruôm 1 (Tiếng Ê đê Quyển 1), Klei Ê đê Hdruôm 2 (Tiếng Ê đê Quyển 2), Klei Ê đê Hdruôm 3 (Tiếng Ê đê Quyển 3). Bên cạnh đó còn có các sách bài tập giúp cho HS ôn luyện: Hdruôm hra klei nga Klei Ê đê, Hdruôm 1 (Sách bài tập tiếng Ê đê, quyển 1), Hdruôm hra klei nga Klei Ê đê, Hdruôm 2 (Sách bài tập tiếng Ê đê, quyển 2), Hdruôm hra klei nga Klei Ê đê, Hdruôm 3 (Sách bài tập tiếng Ê đê, quyển 3) cho học sinh. Ngoài ra còn có những cuốn sách hướng dẫn giảng dạy cho giáo viên, như: Klei Ê đê, Hdruôm hra kơ nai mtô, Hdruôm 1 (Tiếng Ê đê, Sách dùng cho giáo viên, Quyển 1), Klei Ê đê, Hdruôm hra kơ nai mtô,

42

Ngôn ngữ số 9 năm 2012

Hdruôm 2 (Tiếng Ê đê, Sách dùng cho giáo viên, Quyển 2), Klei Ê đê, Hdruôm hra kơ nai mtô, Hdruôm 3 (Tiếng Ê đê, Sách dùng cho giáo viên, Quyển 3) cũng đã được xuất bản. Các cuốn sách phục vụ cho chương trình dạy – học tiếng Ê đê ở bậc TH có nội dung phong phú hơn, khoa học hơn, hình thức đẹp hơn, và đủ số lượng để cung cấp cho giáo viên và HS. 2.2.2. Sự phát triển về số lượng học sinh Từ một vài điểm trường còn được giữ lại để tiếp tục thí điểm, thì năm học 2000-2001, toàn tỉnh đã có 2.205 HS TH theo học chương trình TMĐ. Theo đà đó, cứ mỗi năm ở đây lại tăng thêm số huyện, số điểm trường, STT

Số huyện, thành phố mở lớp

Năm học

Số lớp

1

05

2000 – 2001

20

112

2.205

2

06

2001 – 2002

27

165

3.853

3

07

2002 – 2003

32

185

4.563

4

08

2003 – 2004

39

205

5.673

Chỉ trong vòng 4 năm (từ năm học 2000-2001 đến năm học 20032004), thì mỗi năm ở Đắc Lắc lại tăng thêm một huyện tổ chức dạy TMĐ cho HS, còn số điểm trường cũng tăng dần theo. Đặc biệt, sau 4 năm học, số lượng HS Ê đê theo học chương trình TMĐ đã tăng gấp gần hai lần về số lớp (205/112 lớp), và hơn 2 lần về số HS (5673/2205 HS). Lúc này, môn dạy – học tiếng Ê đê này đã có chuyển hướng. Nó được dạy – học như một môn học trong trường học,

chứ không phải theo chương trình song ngữ Ê đê – Việt như trước đây. Sau khi được chia tách tỉnh, số lượng HS Ê đê theo học chương trình TMĐ ở Đắc Lắc hàng năm vẫn không ngừng gia tăng. Năm học 2008-2009, chỉ tính riêng tỉnh Đắc Lắc đã có tới 10.914 HS TH được học chữ dân tộc ở 474 lớp và 72 trường được mở tại 13 huyện/ thành phố. Và đến năm học 2010-2011, toàn tỉnh đã phát triển dạy – học tiếng Ê đê tại 14 huyện, thành phố, thị xã ở 76 điểm trường với 497 lớp và có 11.052 học sinh. Và đến năm học

42

Ngôn ngữ số 9 năm 2012

2011-2012, tại 84 điểm trường, với 527 lớp và có 11.629 học sinh TH. STT

Số huyện, thành phố mở lớp

1

09

2

Năm học

Số lớp

Số học sinh

2004-2005

45

305

7.856

10

2005-2006

56

328

8.651

3

11

2006-2007

60

363

9.863

4

12

2007-2008

70

390

10.671

5

13

2008-2009

72

474

10.914

6

14

2010-2011

76

453

11.101

7

14

2011-2012

84

527

11.629

Trong số các địa phương tổ chức dạy – học TMĐ ở bậc TH cho HS Ê đê thì }ư Mgar là huyện có số trường, lớp và HS tham gia nhiều nhất, còn địa phương có số lượng và tỉ lệ HS học tiếng Ê đê ít nhất (so với số lượng dân cư) là thành phố Buôn Ma Thuột. 2.2.3. Về chất lượng Theo đánh giá của SGD&ĐT Đắc Lắc, thực tế số lượng HS Ê đê theo học TMĐ ở bậc TH có sự gia tăng hàng năm, và chất lượng học tập Năm học

của các em cũng từng bước được cải thiện, song còn chưa đáng kể, thậm chí có năm học sau lại yếu hơn năm học trước. Đồng thời chất lượng học môn học này của học sinh có sự chênh lệch khá lớn giữa các trường do đặc điểm địa lí, phương ngữ của học sinh. Chẳng hạn, theo thống kê và báo cáo của BNCGDDT, chất lượng học môn TMĐ của các em bậc TH trong 5 năm gần đây (từ năm học 2007-2008 đến 2011-2012) như sau:

CHẤT LƯỢNG MÔN HỌC TMĐ giỏi

khá

yếu

trung bình

SL

tỉ lệ %

SL

tỉ lệ %

SL %

tỉ lệ %

SL

tỉ lệ %

2007-2008

640

6,0

7.149

67

2.348

22

534

5,0

2008-2009

710

6,5

6.204

56

3.752

34,2

284

2,5

2009-2010

1.547

15,92

3.534

36,38

4.284

44,1

349

3,6

2010-2011

1.524

13,8

3.532

32,0

5.436

49,2

560

5,0

2011-2012

1.826

15,7

3.963

34,08

5.235

45,02

605

5,2

Tuy nhiên, theo số liệu khảo sát của chúng tôi và báo cáo của các trường

TH thì thực sự chất lượng học tập và sử dụng tiếng (và chữ) Ê đê chưa

Tăng Cường Dạy Tiếng Ê Đê, M’Nông Cho Học Sinh Đắk Lắk

Sáng 15/9, Đoàn khảo sát Hội đồng tư vấn về vấn đề dân tộc (Ủy ban Trung ương MTTQ Việt Nam) do bà Hà Thị Khiết, Phó Chủ tịch, Chủ nhiệm Hội đồng tư vấn về dân tộc của UBTƯ MTTQ Việt Nam làm trưởng đoàn đã có buổi khảo sát chính sách dân tộc tại tỉnh Đắk Lắk.

Phó Chủ tịch UBTƯ MTTQ Việt Nam Nguyễn Hữu Dũng tham dự buổi khảo sát.

Phát biểu khai mạc tại buổi khảo sát, bà Hà Thị Khiết nhấn mạnh, Đắk Lắk là địa bàn có đông đồng bào các dân tộc cùng sinh sống. Trong những năm qua, với sự quan tâm của Đảng và Nhà nước cũng như nỗ lực của cấp ủy đảng, chính quyền và nhân dân trên địa bàn tỉnh trong công tác tuyên truyền, thực hiện các chủ trương, đường lối của Đảng, chính sách, pháp luật của Nhà nước nói chung, chính sách dân tộc nói riêng đã góp phần phát triển kinh tế-xã hội, cải thiện và nâng cao đời sống vật chất, tinh thần của đồng bào dân tộc thiểu số (DTTS); giữ vững ổn định chính trị, trật tự an toàn xã hội.

Tuy nhiên nhìn chung đời sống kinh tế vùng đồng bào DTTS còn chậm phát triển, còn gặp nhiều khó khăn, thu nhập thấp, tỷ lệ hộ nghèo còn cao, nhất là đồng bào DTTS ở vùng sâu, vùng xa, vùng biên giới.

Vì vậy, việc khảo sát kết quả triển khai thực hiện Nghị định số 82/2010/NĐ-CP ngày 15/7/2010 của Chính phủ về “Quy định việc dạy và học tiếng nói, chữ viết của dân tộc thiểu số trong các cơ sở giáo dục phổ thông và trung tâm giáo dục thường xuyên” ở địa phương; và Quyết định số 498/QĐ-TTg của Thủ tướng Chính phủ: Phê duyệt Đề án “Giảm thiểu tình trạng tảo hôn và hôn nhân cận huyết thống trong vùng dân tộc thiểu số giai đoạn 2015-2020” sẽ giúp cho đoàn khảo sát Hội đồng tư vấn về vấn đề dân tộc có những thông tin, tài liệu tham khảo để có những ý kiến đề nghị từng bước điều chỉnh các chính sách dân tộc cho phù hợp, sát với đời sống thực tế của đồng bào các dân tộc.

Chủ nhiệm Hội đồng tư vấn về dân tộc của UBTƯ MTTQ Việt Nam Hà Thị Khiết phát biểu tại buổi làm việc.

Theo báo cáo đánh giá kết quả triển khai thực hiện Nghị định số 82/2010/NĐ-CP của Ủy ban MTTQ Việt Nam tỉnh Đắk Lắk, hiện toàn tỉnh có 47 dân tộc anh em cùng sinh sống, với tỷ lệ học sinh DTTS chiếm hơn 34% trong toàn ngành giáo dục. Trong đó học sinh dân tộc Ê đê là học sinh dân tộc chiếm tỷ lệ cao nhất trong số học sinh DTTS tại chỗ của tỉnh.

Căn cứ vào nguyện vọng của đồng bào Ê đê muốn con em được học tiếng mẹ đẻ bảo tồn tiếng nói và chữ viết của dân tộc mình, tỉnh Đắk Lắk đã triển khai dạy học môn tiếng Ê đê trong nhà trường phổ thông bắt đầu từ năm học 1980-1981.

Năm học 2016-2017, toàn ngành giáo dục Đắk Lắk có 1.012 trường, 17.770 lớp với 454.653 học sinh từ mầm non đến THPT, trong đó học sinh DTTS có 156.883 học sinh (chiếm tỷ lệ 34,8%), so với năm học 2015-2016 tăng 14 trường, 475 lớp, tăng 59 học sinh.

Việc giảng dạy tiếng Ê đê trong trường tiểu học tại Đắk Lắk được thực hiện trong 3 năm học, mỗi năm có 140 tiết học thực hiện trong 35 tuần học, mỗi tuần 4 tiết học. Tuy nhiên, đến nay việc giảng dạy cho học sinh từ khối 6 trở lên, ngành giáo dục địa phương tự ban hành chương trình, vì Bộ GD&ĐT chưa ban hành sách giáo khoa dạy tiếng Ê đê.

Dân tộc M’nông là DTTS có số lượng đông thứ 2 trong các DTTS tại chỗ trong tỉnh Đắk Lắk. Theo nguyện vọng của đồng bào dân tộc M’nông, UBND tỉnh đã có chủ trương tổ chức dạy tiếng M’nông vào dạy trong các trường tiểu học có đông học sinh dân tộc M’nông. Nhưng hiện nay sách giáo khoa tiếng M’nông của Bộ GD&ĐT vẫn chưa phát hành nên vẫn chưa triển khai được.

Theo số liệu thống kê qua các năm của Sở Y tế đến nay tỷ lệ tảo hôn qua năm 2016 là 716 gia đình, trong 6 tháng đầu năm 2017 là 191 gia đình. Tỷ lệ kết hôn cận huyết thống năm 2016 là 6 cặp vợ chồng, 6 tháng đầu năm 2017 là 2 cặp vợ chồng.

Nguyên nhân của việc kết hôn cận huyết thống là do những tập tục lâu đời của một số đồng bào DTTS, một bộ phận không nhỏ các cặp vợ chồng kết hôn với nhau nhưng lại có quan hệ trong dòng tộc như con chú, con bác, côn cô, con cậu… do thừa kế tư duy về sự gần gũi trong dòng tộc và tài sản của bố mẹ để lại cho con cháu không bị chia sẻ cho dòng họ khác. Do trình độ dân trí thấp, lao động chủ yếu là thủ công, năng suất lao động thấp, lấy vợ lấy chồng sớm để có thêm nhân lực lao động cũng là nguyên nhân của tình trạng tảo hôn…

Mặt trận các cấp đã phối hợp với các tổ chức thành viên, trong đó chú trọng vai trò của Hội liên hiệp Phụ nữ trong việc triển khai thực hiện các chương trình tuyên truyền, vận động đến đồng bào các dân tộc trên địa bàn tỉnh về tác hại của việc tảo hôn và hôn nhân cận huyết thống. Cùng với đó, MTTQ tỉnh phối hợp với Ban Dân tộc tổ chức 5 lớp tập huấn, bồi dưỡng kiến thức về các chính sách dân tộc cho 557 người có uy tín trong đồng bào DTTS của 9/15 huyện, thị xã, thành phố.

Đối với Đề án “Giảm thiểu tình trạng tảo hôn và hôn nhân cận huyết thống trong vùng đồng bào DTTS” giai đoạn 2015-2015, MTTQ tỉnh mong muốn Mặt trận các cấp và các tổ chức chính trị-xã hội, đoàn thể và người uy tín phát huy hơn nưa vai trò của mình trong việc tuyên truyền, vận động đồng bào DTTS xóa bỏ những hủ tục, tập quán lạc hậu và phòng chống tảo hôn.

Cập nhật thông tin chi tiết về Đề Tài: Môi Trường Xử Lý Tiếng Ê Đê Ứng Dụng Trong Dạy Và Học trên website Theolympiashools.edu.vn. Hy vọng nội dung bài viết sẽ đáp ứng được nhu cầu của bạn, chúng tôi sẽ thường xuyên cập nhật mới nội dung để bạn nhận được thông tin nhanh chóng và chính xác nhất. Chúc bạn một ngày tốt lành!