NGÀNH CNTT TUYỂN SINH NHIỀU CHỈ TIÊU NGÀNH CNTT, CNTT VIỆT NHẬT VÀ KHOA HỌC DỮ LIỆU

Nâng cao hiệu quả hoạt động của Bộ mã hóa tự động kết hợp điều chế OFDM trong mạng di động 5G

on .

Nâng cao hiệu quả hoạt động của Bộ mã hóa tự động kết hợp điều chế OFDM trong mạng di động 5G

Nguyễn Tiến Thành - CH1802059

Trong thời gian gần đây, sự phát triển vượt bậc của mạng truyền thông không dây và di động đã tạo ra nhu cầu cấp thiết về tốc độ và độ tin cậy trong truyền dữ liệu, cũng như việc tối ưu hóa năng lượng và hiệu suất phổ [1]. Các hệ thống truyền thông nói chung và mạng di động 5G nói riêng phải đáp ứng và đạt được một loạt các mục tiêu cho việc phát triển mạng không dây trong tương lai. Điều này bao gồm việc đặt người dùng vào tâm điểm, hỗ trợ truyền dẫn toàn dải, đảm bảo mức độ bảo mật mạnh mẽ và xây dựng hệ thống thông minh. Trong quá trình phát triển mạng di động 5G, đặc biệt là trong lĩnh vực truyền thông không dây, có một vai trò quan trọng trong các ngành công nghiệp như nhà máy thông minh, giao thông và năng lượng, cũng như các lĩnh vực công cộng như y tế, tự động hóa, công nghệ phương tiện và giáo dục. Do đó, một trong những thách thức quan trọng trong thời đại công nghệ hiện nay là tăng cường hiệu suất và tốc độ truyền dữ liệu trong mạng không dây nói chung và mạng di động 5G nói riêng.

Nhằm giải quyết vấn đề trên, các nhà nghiên cứu đã đề xuất các phương pháp giải quyết sau đây: một là, sử dụng các loại mã hóa kênh truyền như Hamming, Turbo, Polar hay LDPC; hai là, sử dụng các loại điều chế đa sóng mang như OFDM (Orthogonal Frequency Division Multiplexing), FBMC (Filter-bank Multi-carrier), GFDM (Generalized Frequency Division Multiplexing) , …; và một hướng đi mới cũng đem lại rất nhiều triển vọng đó là ứng dụng lĩnh vực học sâu vào trong các hệ thống mạng không dây. Cả ba phương pháp trên đều có những ưu và nhược điểm, tuy nhiên, việc sử dụng lĩnh vực học sâu đang được kì vọng hơn cả không chỉ bởi tính đơn giản trong việc thiết kế mà các tiếp cận này còn được kì vọng sẽ phá vỡ các hạn chế phổ biến trong các hệ thống thông tin liên lạc như giới hạn Shannon.

Gần đây, cùng với sự phát triển trong lĩnh vực học sâu, nhiều nghiên cứu đã đề xuất sử dụng học sâu để tối ưu toàn bộ (học toàn bộ – end-to-end learning) cho các hệ thống truyền thông. Nổi bật trong đó là bộ mã hóa tự động (autoencoder) [1, 2, 3]. Trái ngược với các hệ thống thông tin liên lạc truyền thống, bộ mã hóa tự động cho phép tối ưu hóa chung máy phát và máy thu cho bất kì mô hình kênh nào mà không bị giới hạn bởi việc tối ưu hóa các khối riêng biệt như mã hóa kênh truyền, điều chế, cân bằng kênh, v.v. Cách tiếp cận này được kì vọng phá vỡ các hạn chế phổ biến trong các hệ thống thông tin liên lạc truyền thống bằng cách chuyển từ các khối con được tối ưu độc lập sang các mạng nơ-ron nhân tạo (Neural Network) thích ứng và linh hoạt.

Nhược điểm chung của việc ứng dụng lĩnh vực học sâu nói chung và bộ mã hóa tự động nói riêng đó là hiệu suất của hệ thống phụ thuộc vào dữ liệu học của kênh truyền phải nhiều và dữ liệu học phải đủ lớn. Tuy nhiên, ưu thế của việc ứng dụng bộ mã hóa tự động vào trong hệ thống mạng không dây đó là độ phức tạp của máy phát và máy thu tín hiệu thấp, điều này khiến cho độ khả thi trong việc áp dụng vào trong thực tiễn cũng trở nên triển vọng hơn.

Đề tài đặt mục tiêu là Nghiên cứu các giải pháp nhằm nâng cao hiệu quả hoạt động của bộ mã hóa tự động kết hợp điều chế OFDM trong kênh truyền dẫn đa đường đối với hệ thống 5G NR.

Trong khuôn khổ luận văn đã đề cập và trình bày chi tiết sơ đồ ứng dụng bộ mã hóa tự động (Autoencoder) trong hệ thống truyền thông tin đơn và đa sóng mang (OFDM). Từ cơ sở lý thuyết cũng như kết quả mô phỏng đưa ra những kết luận sau:

  • Trong trường hợp không sử dụng mã hóa kênh truyền, các hệ thống truyền thông sử dụng bộ mã hóa tự động cũng như là các hệ thống truyền thông sử dụng các phương pháp điều chế tín hiệu truyền thống đem lại hiệu năng tương đương nhau theo thông số BLER.
  • Khi so sánh hệ thống truyền thông sử dụng bộ mã hóa tự động với hệ thống sử dụng mã hóa kênh truyền LDPC với tốc độ mã hóa tương ứng, đối với điều chế bậc thấp như QPSK hay 16-QAM (PSK) các hệ thống truyền thông truyền thống vẫn đem lại hiệu quả tốt hơn hoặc tương đương với các hệ thống sử dụng bộ mã hóa tự động. Tuy nhiên đối với trường hợp các loại điều chế bậc cao như 64-QAM hay 256-QAM, hệ thống truyền thông sử dụng bộ mã hóa tự động lại đem lại hiệu năng vượt trội so với hệ thống truyền thông sử dụng mã hóa kênh truyền LDPC tại vùng có tỉ lệ năng lượng tín hiệu/nhiễu thấp. Ngoài ra độ phức tạp trong việc ứng dụng bộ mã hóa tự động trong hệ thống truyền thông cũng thấp hơn so với việc thiết kế bộ mã hóa và giải mã hóa LDPC. Từ đó, trong các hệ thống truyền thông trong tương lai, các hệ thống sử dụng bộ mã hóa tự động nói riêng và ứng dụng lý thuyết học sâu nói chung sẽ được đề xuất nhằm nâng cao hiệu năng của các hệ thống đó.

Trân trọng.

Số hóa các chức năng An sinh xã hội tại một Phường ở Thành phố Hồ Chí Minh

on .

Số hóa các chức năng An sinh xã hội tại một Phường ở Thành phố Hồ Chí Minh

Nguyễn Thị Thu Vân – CH1902027

Trong tiến trình chuyển đổi số, Ngành Lao động, Thương binh và Xã hội (LĐTBXH) cần ứng dụng công nghệ thông tin (CNTT) một cách tổng thể và toàn diện, trong đó đặc biệt chú trọng tới xây dựng một cơ sở dữ liệu (CSDL) tập trung và hệ thống quản lý chặt chẽ, thống nhất các nghiệp vụ, quy trình trong tất cả các lĩnh vực, góp phần thúc đẩy triển khai các hoạt động An sinh xã hội (ASXH) đối với mọi người lao động, toàn dân của Ngành LĐTBXH.

Hiện tại, các hệ thống thông tin/phần mềm của ngành LĐTBXH đang hoạt động độc lập, không đồng nhất và thiếu sự kết hợp. Cơ sở dữ liệu phân tán không có khả năng liên kết và kế thừa dữ liệu giữa các phân hệ. Đáng chú ý là nhiều đối tượng hưởng trợ cấp không đúng/ đủ (một đối tượng hưởng cùng lúc nhiều chính sách, hoặc không được hưởng trợ cấp nào).

Căn cứ hiện trạng như trên, đề xuất triển khai giải pháp “Số hóa các chức năng An sinh xã hội tại một Phường ở Thành phố Hồ Chí Minh” bao gồm các phân hệ chính như sau:

  • Phân hệ Quản lý Trẻ em – Bình đẳng giới
  • Phân hệ Quản lý Bảo trợ xã hội – Hộ nghèo
  • Phân hệ Quản lý Hồ sơ Người có công
  • Phân hệ báo cáo và phân tích số liệu ASXH

Kết quả đạt được:

  • Phân tích được bài toán cụ thể: Số hóa một số chức năng ASXH cho một/ nhiều Phường xã có nhu cầu. Hệ thống được xây dựng cho một Phường thực tế là Phường Tân Hưng Thuận – Quận 12 – TP. Hồ Chí Minh, có thể mở rộng triển khai cho 11, Phường trên địa bàn Quận 12.
  • Phân tích và thiết kế hệ thống quản lý dữ liệu về Nhân khẩu/ Hộ gia đình/ HN-HCN/Diện chính sách - NCC, mô tả chi tiết các chức năng chính của Hệ thống.
  • Dữ liệu được tổ chức đầu vào, xây dựng được nhiều biểu đồ thống kê để phân tích số liệu về nhân khẩu/ hộ gia đình, biến động HN-HCN, các chỉ số ảnh hưởng đến biến động HN-HCN, cơ cấu của diện chính sách/ NCC,...

Trân trọng.

Phân tích các yếu tố ảnh hưởng đến tiến độ và tỉ lệ nộp chứng chỉ tiếng Anh của sinh viên Trường Đại học Công nghệ Thông tin

on .

Phân tích các yếu tố ảnh hưởng đến tiến độ và tỉ lệ nộp chứng chỉ tiếng Anh của sinh viên Trường Đại học Công nghệ Thông tin

Nguyễn Thị Hoài - CH1802042

Theo thống kê, tỷ lệ sinh viên theo học chương trình đào tạo của Trường Đại học Công nghệ Thông tin – Đại học Quốc gia Thành phố Hồ Chí Minh và tốt nghiệp đúng hạn là chưa cao (khoảng 30-40%). Một trong nhiều nguyên nhân là do thiếu chứng chỉ tiếng Anh, ảnh hưởng trực tiếp đến việc xét tốt nghiệp của sinh viên [1,2]. Trong đề tài này, tác giả tìm hiểu và phân tích các yếu tố ảnh hưởng đến tiến độ và tỷ lệ nộp chứng chỉ tiếng Anh của sinh viên, và đề xuất một số giải pháp nhằm động viên và khuyến khích sinh viên nộp chứng chỉ tiếng Anh đúng hạn.

Thông thường, tiến độ và tỉ lệ nộp chứng chỉ tiếng Anh bị ảnh hưởng bởi nhiều yếu tố: bao gồm bản thân sinh viên (tuổi, giới tính, nơi học phổ thông, trình độ tiếng Anh đầu vào, kết quả học tập tiếng Anh tại trường đại học...), các quy định của Trường (như quy định về đăng ký các khóa tiếng Anh tự chọn hay bắt buộc, quy định về các văn bằng tiếng Anh thay thế...). Tất cả các nghiên cứu hiện tại đều không tiến hành phân tích sâu tầm ảnh hưởng của yếu tố kể trên cho tiến độ và tỷ lệ nộp chứng chỉ tiếng Anh.

Xuất phát từ những hạn chế nêu trên và yêu cầu thực tiễn, nghiên cứu này đặt ra 2 mục tiêu chính: (A) Phân tích ảnh hưởng của biến độc lập lên 2 biến phụ thuộc: (1) tiến độ nộp chứng chỉ tiếng Anh và (2) tỷ lệ nộp chứng chỉ tiếng Anh, và (B) Đánh giá hiệu quả các nhóm môn tiếng Anh sinh viên đăng ký theo học đến tiến độ và tỉ lệ nộp chứng chỉ tiếng Anh.

Kết quả đạt được:

  • Phân tích được ảnh hưởng các yếu tố chủ quan từ bản thân sinh viên như: trình độ tiếng Anh đầu vào, hệ đào tạo, khoa, giới tính, kết quả học tập, điểm rèn luyện. Từ đó, rút ra được các kết quả về sự ảnh hưởng của các yếu tố trên đối với tiến độ và tỉ lệ nộp chứng chỉ tiếng Anh.
  • Phân tích được ảnh hưởng của các yếu tố khách quan từ các chính sách về đào tạo tiếng Anh của Trường như chính sách tiếng Anh quá trình, miễn giảm tiếng Anh quá trình, và chuẩn đầu ra tiếng Anh. Từ đó có thể thấy được tác động tích cực của việc thực hiện trong vai trò thúc đẩy việc học tập tiếng Anh.

Trân trọng.

Phát hiện lỗ hổng trên ứng dụng web sử dụng kỹ thuật phân tích động và thuật giải di truyền

on .

Phát hiện lỗ hổng trên ứng dụng web sử dụng kỹ thuật phân tích động và thuật giải di truyền

Ngô Khánh Khoa - CH1802047

Các trang web hiện nay tồn tại rất nhiều đầu vào để tương tác với ứng dụng và vô vàn các logic xử lý ở mỗi đầu vào. Do đó, việc kiểm tra và xử lý toàn bộ đầu vào tốn nhiều thời gian và công sức. Thông thường, việc kiểm tra đầu vào này sẽ được kiểm tra bởi các kỹ sư an ninh mạng, đánh giá an toàn thông tin. Công việc của họ là truy cập tất cả đầu vào có thể, thử nghiệm nhằm tìm kiếm điểm yếu của ứng dụng, từ đó thông báo cho người quản trị web có thể khắc phục lỗ hổng trước khi nó bị khai thác bởi kẻ xấu. Tuy nhiên, cách làm này phụ thuộc vào chuyên gia đánh giá và tốn nhiều thời gian. Phương pháp tiết kiệm hơn là dùng các công cụ rà quét tự động. Nhiệm vụ của chúng là từ các đầu vào có thể có, truyền các mã khai thác vào và kiểm tra phản hồi ứng dụng. Nếu phát hiện lỗ hổng, công cụ sẽ ghi nhận kết và và gửi cho người dùng công cụ để phân tích và vá kịp thời lỗ hổng.

Tuy rằng công cụ kiểm thử tự động có thể chạy được với gần như toàn bộ các ứng dụng web và tương đối dễ sử dụng, nhưng nó cũng có một số hạn chế đáng kể. Phương pháp này có thể phải sử dụng nhiều tài nguyên và thời gian thực thi phụ thuộc vào số lượng đầu vào của ứng dụng, và không kiểm tra được toàn bộ các đầu vào có thể gây ra lỗi. Điều này có thể làm lãng phí tài nguyên và giảm hiệu suất kiểm thử tự động. 

Để cải thiện việc này, một giải pháp có thể là sử dụng phương pháp thuật giải di truyền. Trong mô hình này, quá trình tiến hoá được thêm vào giữa giai đoạn chọn mã khai thác, giúp chọn lọc những mã khai thác phù hợp với đầu vào đang kiểm tra. Bằng cách kết hợp các mã khai thác tiềm năng với một đầu vào cụ thể với các mã khai thác khác có thể tạo ra điểm đột biến tại đầu vào đó, đi sâu vào các nhánh mã nguồn ứng dụng và truy cập đến các vị trí có thể tạo ra lỗi trên ứng dụng. Việc này giúp tăng cường hiệu quả của phương pháp kiểm thử tự động và giảm thiểu lãng phí tài nguyên.

Luận văn này sẽ tập trung nghiên cứu trên các ứng dụng web chạy ngôn ngữ PHP, và một trong những lỗ hổng bảo mật tiềm tàng của nó là lỗ hổng thực thi mã từ xa (RCE). Phương pháp kiểm thử tự động fuzzing sẽ được triển khai để tìm kiếm lổ hổng bảo mật trong ứng dụng web. Nhằm tăng cường chất lượng của quá trình fuzzing, thuật giải di truyền sẽ được thêm vào để xử lý mã khai thác phải thực hiện. Kết quả của nghiên cứu là mong muốn tìm cách giảm thiểu số lượng đầu vào cần xử lý trong quá trình fuzzing, đồng thời tăng khả năng tìm kiểm lỗ hổng bảo mật trên ứng dụng web.

Cụ thể hơn, công việc thực hiện sẽ là kết hợp thuật giải di truyền và công cụ webfuzz để cải thiện quá trình fuzzing. Các quá trình chọn lọc, tiến hoá của thuật giải sẽ được sử dụng để tạo ra các mã khai thác phù hợp với đầu vào đang kiểm tra, từ đó tạo ra các đột biến tại đầu vào đó. Việc sử dụng công cụ webfuzz sẽ giúp đưa ra các đầu vào ngẫu nhiên và đa dạng hơn, tăng khả năng tìm ra các lỗ hổng trong ứng dụng web.

Kết quả nghiên cứu giúp tăng cường khả năng phát hiện lỗ hổng của phương pháp phân tích động, đồng thời tăng cường hiệu suất và giảm thiểu thời gian và tài nguyên tiêu hao trong suốt quá trình thực thi mô hình.

Kết quả đạt được:

  • Thực hiện nghiên cứu và áp dụng phương pháp phân tích động sử dụng thuật giải di truyền trong việc đánh giá ứng dụng web mã nguồn mở và đạt được kết quả tăng độ bao phủ mã khi thực hiện fuzzing và tìm kiếm được các lỗ hổng RCE có tồn tại trong ứng dụng.
  • Trong quá trình tích luỹ, thu thập mã khai thác, luận văn đã tổng hợp được tập dữ liệu mã khai thác lỗi RCE. Tập dữ liệu này được sử dụng trong quá trình fuzzing của mô hình, đồng thời khi sử dụng trên các công cụ khác cũng đạt được kết quả tốt.
  • Kết quả đánh giá cũng được so sánh với công cụ fuzzing hộp đen wfuzz và ffuf và cho ra kết quả tích cực về hướng phát triển của fuzzing kết hợp thuật giải di truyền.

Trân trọng.

Rút trích quan hệ giữa các thực thể trong văn bản tiếng Việt

on .

Rút trích quan hệ giữa các thực thể trong văn bản tiếng Việt

Phạm Minh Mẫn - CH1802054

Rút trích quan hệ là một trong những bài toán quan trọng trong xử lý ngôn ngữ tự nhiên (NLP). Nó là bài toán con của bài toán trích xuất thông tin, được ứng dụng rộng rãi trong nhiều bài toán như sơ đồ tri thức, hỏi đáp tự động, tóm tắt văn bản,... Với sự phát triển không ngừng của dữ liệu, đặc biệt là dữ liệu dạng văn bản, bài toán này càng nhận được sự quan tâm hơn đối với các nhà nghiên cứu cả trong và ngoài nước. Tuy nhiên, số lượng các nghiên cứu về bài toán rút trích quan hệ trong văn bản tiếng Việt vẫn còn hạn chế so với các ngôn ngữ khác như tiếng Anh, tiếng Trung,… Do đó, luận văn nghiên cứu sâu hơn về đề tài này.

Về mặt thực tiễn, rút trích quan hệ có nhiều ứng dụng trong các lĩnh vực bao gồm:

- Khai phá dữ liệu từ Web (Web mining): nghiên cứu đối thủ cạnh tranh, rút trích tên người nổi tiếng, các sản phẩm đang thịnh hành, so sánh giá cả sản phẩm, phân tích tâm lý của khách hàng.

- Trí tuệ doanh nghiệp (Business intelligent): đánh giá thông tin thị trường từ các điều luật mới trong thị trường kinh doanh, các thông tin về chính trị giữa các nước...

Về mặt khoa học, nghiên cứu có những đóng góp sau:

- Nắm được tình hình nghiên cứu trong nước và trên thế giới, cũng như xu hướng phát triển của bài toán rút trích quan hệ và các bài toán có liên quan như đồng tham chiếu.

- Thảo luận, đánh giá các phương pháp rút trích quan hệ và phương pháp xử lý phân giải đồng tham chiếu, đồng thời đề xuất một số hướng phát triển tiếp theo của bài toán.

Luận văn đã đạt được những kết quả sau:

- Nắm được tổng thể về bài toán rút trích quan hệ, tình hình các nghiên cứu trong nước và trên thế giới, các xu hướng phát triển của bài toán rút trích quan hệ và các bài toán có liên quan như phân giải đồng tham chiếu.

- Trên cơ sở kế thừa và nghiên cứu các mô hình kết hợp dựa trên BERT để xử lý bài toán RE trong tiếng Việt, luận văn so sánh mô hình kết hợp dựa trên mô hình PhoBERT và XLM-RoBERTa [22] với mô hình đơn lẻ như PhoBERT. Từ đó, có thể thấy rằng phương pháp áp dụng các mô hình kết hợp cho kết quả tối ưu hơn so với phương pháp áp dụng mô hình đơn lẻ.

- Đề xuất, đánh giá phương pháp phân giải đồng tham chiếu mới cho văn bản tiếng Việt để phục vụ cho bài toán rút trích quan hệ với F1 dựa trên ba độ đo MUC, B3, CEAFe lần lượt đạt 66.50%, 82.70%, 76.26%.

- Xây dựng hệ thống demo cho bài toán RE trong văn bản tiếng Việt.

Tuy nhiên, ngoài các kết quả đạt được, luận văn vẫn còn một vài hạn chế sau:

- Chưa giải quyết bài toán mất cân bằng dữ liệu trong việc huấn luyện mô hình RE trong tiếng Việt.

- Chưa kết hợp kết quả của bài toán đồng tham chiếu vào hệ thống RE đã xây dựng.

Trân trọng.