NGÀNH CNTT TUYỂN SINH NHIỀU CHỈ TIÊU NGÀNH CNTT, CNTT VIỆT NHẬT VÀ KHOA HỌC DỮ LIỆU

BÀI VIẾT SỐ 1 GIỚI THIỆU NGÀNH CNTT

on .

Sinh viên: Lê Mậu Anh    MSSV: 23520047    Lớp: CNNB 2023.1

Giới Thiệu Công Nghệ Thông Tin

Những năm đại học là khoảng thời gian quý báu dành cho các bạn trẻ, vì trong khoảng thời gian này các bạn không những chỉ học được các kiến thức từ những môn của chương trình đào tạo, tiếp thu các bài học quý giá từ xã hộị hay khám phá những điều mới mà còn là thời gian mà các bạn sinh viên tự tạo ra những khát vọng, mục tiêu hoài bão của riêng mình và từ đó bắt đầu hành trình chinh phục những mục tiêu ấy. Em cũng không khác gì đa số các bạn,  anh chị sinh viên khác, em cũng có 5 mục tiêu riêng  cho bản thân sau 4 năm, lần lượt là:

+Đang được đi du học bằng cử nhân năm thứ 3 hoặc năm thứ 4 tại các nước phương Tây với học bổng 50% trở lên.

+Xác định được mảng riêng của  CNTT phù hợp với bản thân.

+Được đi thực tập tại các công ty phương tây có mức lương phù hợp với công việc, coi trọng sự cân bằng đời sống và công việc của nhân viên.

+Được nhận phỏng vấn cho vị trí thực tập từ các công ty lớn như Microsoft, Google, Adobe,..

+Nhận thức được những con đường tệ nạn, tiêu cực trong nghề cntt.

Đối với mục tiêu được đi du học thì em khao khát được  trải nghiệm nền văn hóa từ một quốc gia hay những người mang quốc tịch khác, được tiếp cận với nền giáo dục hiện đại, sáng tạo hay luôn luôn cải tiến của các nước phát triển hoặc được tiếp xúc với những bài giảng dạy hay những cuộc thuyết trình của những giáo sư giỏi, nổi tiếng của thế giới để có thể mở mang tri thức, tư duy và từ đó đóng góp phần nào cho sự phát triển của quê hương. tăng cơ hội việc làm.

Ở mục tiêu thứ hai, việc tìm ra được lĩnh vực CNTT phù hợp với bản thân sẽ giúp em phát triển một cách hiệu quả và tối đa lĩnh vực thuộc về thế mạnh hay phù hợp với tính cách của bản thân. Không chỉ dừng lại ở đó, việc xác định được con đường phù hợp sẽ giúp bản thân em vào thời sau 4 năm đó có thể giúp em trong việc đi phỏng vấn tìm việc làm tại các công ty vì lúc đó em biết mình giỏi và phù hợp với lĩnh vực gì, từ đó giúp bản thân em đỡ lan man hay suy nghĩ tiêu cực khi ra trường.

Được nhận làm thực tập sinh tại các công ty phương tây  (Mỹ, Châu Âu và Úc,..) trở thành mục tiêu thứ 3 của em vì bản thân em thích văn hóa ở các công ty phương Tây hơn những công ty Châu Á nói chung.  Văn hóa ở những công ty này thường không quá khắt khe, không có phân biệt giữa các cấp trong công ty, nhân viên bất kể Freshman, Junior hay Senior thì đều có thể đóng góp cho công ty nếu có năng lực, thay vì chỉ được phép làm mỗi việc được giao. Sự đa dạng quốc tịch cũng là một điểm cộng của những công ty tại Mỹ, Úc và Châu Âu trong mắt em. Vì khi được làm việc trong môi trường có nhiều người đến từ những nước khác thì em sẽ được khám phá, học hỏi những góc độ quan điểm, tư duy khác nhau. Chế độ lương đãi ngộ cũng là một trong những lí do chính, chế độ lương đãi ngộ tại các công ty công nghệ Mỹ, Châu Âu và Úc thường sẽ tốt hơn các công ty của các nước Châu Á, các công ty phương tây cũng thoải mái hơn về chuyện tiền lương hơn so với các công ty phương Đông, miễn là mình có năng lực. Lí do cuối cùng là em muốn được đảm bảo sự cân bằng giữa công việc và đời sống, cũng vì văn hóa các nước phương tây đề cao sự độc lập của mỗi cá thể nên các công ty cũng rất quan tâm đến cân bằng giữa đời sống và công việc của nhân viên, đưa ra yêu cầu công việc phù hợp với mức lương nhằm tạo ra môi trường mà ở đó mọi người có thể làm viêc năng suất để cống hiến cho công ty.

Việc được nhận phỏng vấn cho vị trí thực tập từ các công ty lớn như Google, Microsoft hay Adobe có thể là một trong những mục tiêu khó nhất trong danh sách vì môi trường ở những công ty này gần như hoàn hảo về mọi mặt, từ chế độ lương đãi ngộ, tới thành phần nhân sự của công ty hay các vấn đề khác như sức khỏe tinh thần cho nhân viên nên đầu vào thường rất khó khăn và đầy thử thách. Chính vì vậy việc đặt mục tiêu lớn như vậy sẽ giúp em cố gắng học tập và không ngừng học hỏi để có thể tiến bộ dần theo thời gian, trong trường hợp không được nhận ở lại cho vị trí chính thức hay vị trí thực tập tại những công ty đó thì khả năng của em vẫn được chứng minh phần nào mắt ban tuyển dụng của những công ty khác.

Mục tiêu cuối cùng của em trong danh sách là nhận thức được những con đường xấu hay tệ nạn  trong con đường theo đuổi sự nghiệp công nghệ thông tin. Khi hiểu hiểu rõ rủi ro của những con đường ấy thì em sẽ không bị sa ngã bởi những lợi ích trước mắt như tiền bạc, danh dự để rồi làm những việc vô đạo đức, ảnh hưởng đến không chỉ bản thân, gia đình hay thậm chỉ là cả cộng đồng, dẫn đến những hệ lụy tiêu cực đáng tiếc sau này.

Để có thể tiến gần hơn với những mục tiêu trên, cá nhân em sẽ phải nỗ lực theo quá trình theo thời gian bằng cách học môn Tổ chức và cấu trúc máy tính IIđể hiểu hơn về cốt lõi máy tính giúp cho việc học lập trình tốt hơn hay xử lí các vấn đề. Môn Xác xuất thông kê nhằm xây dựng tư duy tốt hơn trong việc giải các bài toán xác xuất sau này. Cấu trúc dữ liệu và giải thuậtsẽ em có tư duy tốt và hiểu biết tốt hơn về cấu trúc dữ liệu và cách tư duy giải quyết các vấn đề về dữ liệu. Môn Phân tích thiết kế phần mềm nhằm hiểu hơn về cách thức thiết kế phần mềm để tạo ra các sản phầm phần mềm nói chung và cuối cùng là môn Pháp luật đại cương để hiểu hơn về những rủi ro, việc nào là vi phạm pháp luật nhằm giúp bản thân em không bị cuốn vào những con đường xấu khi theo đuổi con đường công nghệ.

Tổng kết lại, mục tiêu của em bao gồm được du học, được làm việc tại những công ty phương Tây, hiểu rõ lĩnh vực phù hợp với bản thân và đặc biệt không sa lầy vào những con đường xấu của ngành CNTT, và để đạt được những điều đó thì cá nhân em phải nỗ lực học hỏi không ngừng, chọn những môn phù hợp để có thể phát triển những kỹ năng cần thiết để có thể tiến gần hơn với những mục tiêu mà em đã đề ra trong 4 năm tới.

ỨNG DỤNG GIẢI THUẬT TỐI ƯU BẦY ĐÀN KHAI THÁC TOP-K MẪU HỮU ÍCH CAO

on .

ỨNG DỤNG GIẢI THUẬT TỐI ƯU BẦY ĐÀN KHAI THÁC TOP-K MẪU HỮU ÍCH CAO

Trương Quang Trung - CH1802063

Trong xu thế của nền kinh tế tri thức ngày nay, khi công nghệ thông tin có những bước tiến vượt bậc. Và đã góp mặt ở hầu hết các ngành nghề và không thể thiếu trong kinh doanh, nói đến kinh doanh là nói đến giao dịch mua bán hàng hoá,... Câu hỏi đặt ra là với dữ liệu bán hàng, dữ liệu lớn như vậy (phát sinh hàng ngày, hàng giờ) thì chúng ta có thể khai thác điều gì hữu ích làm cơ sở để hỗ trợ ra quyết định nhằm tối ưu lợi nhuận trong kinh doanh? Từ thực tế đó, khai thác dữ liệu (data mining) đã ra đời, mục tiêu là khai thác dữ liệu đã có, thực hiện quá trình phân loại, sắp xếp các tập hợp dữ liệu để xác định các mẫu và thiết lập các mối liên hệ nhằm giải quyết các vấn đề nhờ phân tích dữ liệu và hướng đi này đã có rất nhiều các công trình nghiên cứu khoa học, tiền đề là khai thác những mẫu xuất hiện thường xuyên trong dữ liệu giao dịch gọi là khai thác mẫu phổ biến.

Bài toán khai thác mẫu phổ biến vốn là một hướng nghiên cứu về khai thác dữ liệu [12] nhằm xác định tập các hạng mục có tần suất xuất hiện cao trong cơ sở dữ liệu giao dịch. Hạn chế là FIM không xét tới số lượng mua các mặt hàng và lợi nhuận của chúng [4]. Để giải quyết khăn của FIM, bài toán khai thác tập mục hữu ích cao (HUIM) được giới thiệu [3],[4]. HUIM không những là một chủ đề được nhiều nhà nghiên cứu quan tâm mà còn là sự quan tâm đặc biệt, nhất là trong khai thác dữ liệu khi đề cập đến việc khai thác các tập mục hữu ích đáp ứng.

Hiện nay nghiên cứu về HUI kết hợp meta-heuristics cũng có khá nhiều, ví dụ như: HUIF-PSO, HUIM-AF, HUIM-HC, HUIM-ACO, HUIF-PS. Tuy nhiên chưa có thuật toán nào áp dụng giải thuật tối ưu bầy đàn kết hợp với TKO (mining Top-k utility itemsets One phase) và TKU (Mining Top-k Utility itemsets) vào việc khai thác Top-k để tìm ra tập hữu ích cao. Lý do chính là do độ hữu ích không thỏa mãn tính chất Apriori (hay còn được biết với tên gọi tính chất bao đóng giảm). Vì vậy, việc tỉa bớt các ứng viên không tiềm năng là không đơn giản như FIM (độ phức tạp thấp) [5], [6]. Bên cạnh đó, khi thực hiện ứng dụng giải thuật tối ưu hoá bầy đàn (PSO) đang nghiên cứu vào khai thác HUIs lại tỏ ra khá hiệu quả để khai thác các tập mục hữu ích cao, khi không phải xử lý vấn đề theo cấp số nhân như thuật toán khai thác HUIs truyền thống, tiết kiệm được thời gian xử lý và bộ nhớ lưu trữ và đây cũng chính là lý do để đề xuất phương pháp mới.

Một trung tâm mua sắm có nhập một lượng mặt hàng rất lớn đến từ nhiều nhà sản xuất khác nhau. Các sản phẩm cửa hàng nhập về được sắp xếp ở nhiều vị trí khác nhau phục vụ cho chiến lược kinh doanh. Những giao dịch khi khách hàng mua sắm gọi là dữ liệu và được lưu dữ lại. Lượng dữ liệu của trung tâm mua sắm là rất lớn. Những nhà lãnh đạo trung tâm này muốn biết sản phẩm hay tập sản phẩm nào mà trung tâm bán ra thu về với nhiều lợi nhuận nhất, đóng góp lợi nhuận cho trung tâm nhiều nhất,… giúp nhà lãnh đạo hiểu rõ hơn về doanh thu và lợi nhuận từ từng nhóm sản phẩm. Dựa trên phân tích các sản phẩm có lợi nhuận cao, người lãnh đạo có thể nhận định được mức độ hiệu quả trong việc kinh doanh các sản phẩm và nhóm sản phẩm. Ngoài ra, tìm kiếm hướng kinh doanh để đạt lợi nhuận mong muốn. Mặt khác cũng giúp cho lãnh đạo nắm bắt được xu hướng thị trường và sự thay đổi trong nhu cầu của khách hàng. Với thông tin này, lãnh đạo có thể đưa ra những quyết định kinh doanh thông minh về việc mở rộng hoặc thu hẹp danh mục hàng hóa, xây dựng và phát triển danh mục các nhóm sản phẩm mang lại lợi nhuận cao.

Kết quả đạt được:

  • Thuật toán tối ưu hóa bầy đàn là một trong những giải pháp đã được quan tâm rất nhiều khi ứng dụng một số bài toán cho kết quả rất tốt. Do đó, với ý tưởng khai thác Top-k mẫu hữu ích cao kết hợp với phương pháp tối ưu hóa PSO thì luận văn cũng đã đạt được kết quả nhất định.
  • Thuật toán Top-k được giới thiệu để khai thác Top-k mẫu hữu ích cao và giới thiệu với hai thuật toán là TKU (TKUBASE) và TKO (TKOBASE). Luận văn thực hiện áp dụng theo thuật toán TKO (TKOBASE) do thuật toán TKO (TKOBASE) được đánh giá là có hiệu quả hơn.
  • Kết quả thực nghiệm nói chung đã cho thấy thuật toán đề xuất cho kết quả rất khả quan, đã tối ưu được bộ nhớ so TKO. Tuy nhiên thuật toán đề xuất chưa thực sự vượt trội về tối ưu về thời gian. Về thuật toán TKU, tác giả trong bài viết [1] đã kết luận thuật toán TKU không cho kết quả tốt hơn so với TKO nên bài luận văn này tập trung so sánh với thuật toán TKO.

Trân trọng.

XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ HỖ TRỢ PHÁT TRIỂN DU LỊCH THÀNH PHỐ CẦN THƠ TRÊN NỀN TẢNG CÔNG NGHỆ GIS

on .

XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ HỖ TRỢ PHÁT TRIỂN DU LỊCH THÀNH PHỐ CẦN THƠ TRÊN NỀN TẢNG CÔNG NGHỆ GIS

TRẦN LÊ DUY ANH - CH2002026

Ngày nay với sự phát triển không ngừng của công nghệ, trong đó các ứng dụng của công nghệ GIS đóng vai trò rất quan trọng và xuất hiện trong rất nhiều lĩnh vực, trong đó có lĩnh vực du lịch, mang đến nhiều tiện ích cho người dùng. Cùng với ngành du lịch Thành phố Cần Thơ nói chung và cả nước nói riêng vẫn chưa hồi phục hoàn toàn sau đại dịch Covid-19. Với ý tưởng giúp du khách khi đến với Thành phố Cần Thơ có trải nghiệm tốt hơn khi nắm bắt được các thông tin liên quan đến du lịch trên địa bàn Thành phố Cần Thơ cũng như dễ dàng tìm đường đi đến các địa điểm du lịch, khách sạn qua đó góp phần phát triển hơn du lịch ở điạ phương.

Trong bối cảnh hiện nay Google map API đã không còn miễn phí với người dùng, gây khó khăn cho việc phát triển và triển khai các hệ thống GIS. Do đó việc ứng dụng các nền tảng mã nguồn mở để xây dựng và triển khai các hệ thống GIS hiện nay đang là xu hướng chung.

Hệ thống sẽ giúp cải thiện việc số hóa và quản lý thông tin du lịch tại thành phố Cần Thơ. Đồng thời hệ thống cũng cung cấp các tính năng hỗ trợ khách du lịch như: gợi ý địa điểm du lịch và nơi lưu trú theo khoảng cách hoặc theo các bộ lọc được hỗ trợ sẵn, chỉ đường đến các địa điểm cần đến. Góp phần nâng cao sự trải nghiệm cho khách du lịch khi đến với Thành phố Cần Thơ với việc có đầy đủ các thông tin về các địa điểm du lịch, khách sạn hay nhà hàng cũng như dễ dàng tìm kiếm đường đi đến các địa điểm.

Một trong các đặc trưng của GIS so với một hệ thống thông tin thuần túy là yếu tố không gian được xuất hiện trong mô hình dữ liệu. Yếu tố không gian khi hiển thị lại sử dụng kỹ thuật đồ họa. Khi hiển thị một đối tượng ở dạng đồ họa, tùy thuộc vào vị trí, khoảng cách, nhu cầu của con người mà một đối tượng lại được hiển thị ở mức chi tiết khác nhau.

Kết quả đạt được:

  • Hệ thống xây dựng hoàn thiện đã đóng góp về mặt thực tiễn với việc thu thập, kiểm tra tính chính xác và xây dựng tọa độ địa lý cho các điểm du lịch, ăn uống và nơi lưu trú tại Thành Phố Cần thơ và góp phần biểu diễn trực quan các địa điểm trên nền tảng GIS.
  • Hệ thống giúp cải thiện việc số hóa và quản lý thông tin du lịch tại thành phố Cần Thơ. Đồng thời cung cấp các tính năng hỗ trợ khách du lịch như: gợi ý địa điểm du lịch, ăn uống và khách sạn theo các bộ lọc được hỗ trợ sẵn, chỉ đường đến các địa điểm cần đến. Góp phần nâng cao sự trải nghiệm cho khách du lịch khi đến với thành phố Cần Thơ với việc có đầy đủ các thông tin về các địa điểm du lịch, ăn uống, khách sạn cũng như dễ dàng tìm kiếm đường đi đến các địa điểm.
  • Hệ thống giúp thống kê các ý kiến, bình luận của người dùng sau khi đến với các địa điểm, góp phần giúp các chủ doanh nghiệp tương tác cũng như cải thiện chất lượng dịch vụ của địa điểm mình.
  • Hệ thống giúp biểu diễn trực quan dữ liệu dưới dạng biểu đồ, giúp du khách cũng như chủ địa điểm du lịch, ăn uống, khách sạn nắm bắt thông tin thống kê thời điểm các lượt khách du lịch đến với thành phố cao hay thấp, khách du lịch trong nước và quốc tế thường đến vào thời gian nào trong năm. Đối với du khách sẽ lựa chọn cho mình thời gian thích hợp khi có nhu cầu du lịch đến với thành phố Cần Thơ. Đối với chủ địa điểm du lịch, ăn uống, khách sạn sẽ thuận tiện cho việc lập kế hoạch hoạt động của địa điểm mình, có thể cải thiện hoặc tăng cường dịch vụ, nhân viên tại các thời gian cao điểm du lịch trong năm.
  • Hệ thống thực tế có thể giúp khách du lịch khi đến với thành phố Cần Thơ có thể tra cứu được các thông tin của các địa điểm du lịch, ăn uống, khách sạn có uy tín ở Thành phố Cần Thơ, là các địa điểm đã được Sở văn hóa – thể thao và du lịch TPCT công nhận và thẩm định, các địa điểm ăn uống, quán ăn lớn, nổi bật được chủ doanh nghiệp liên hệ với Sở để quảng bá thương hiệu.
  • Hệ thống giúp gợi ý địa điểm du lịch, ăn uống, khách sạn dựa trên thuật toán luật kết hợp, trên cơ sở phân tích dữ liệu hệ thống lưu trữ từ các lịch trình du khách trước đã từng tạo, giúp gợi ý địa điểm tối ưu, phù hợp nhất khi du khách mới tạo lịch trình.

Trân trọng.

Cải tiến mô hình phân cụm dựa trên vị trí thông qua mạng nơron đồ thị (GNN)

on .

Cải tiến mô hình phân cụm dựa trên vị trí thông qua mạng nơron đồ thị (GNN)

Tạ Vũ Hoài Thương - CH1802064

Trong nhiều năm qua, phân tích không gian trong đó phân cụm dữ liệu dựa trên GIS [1] [2] [3] [4] đã trở thành một chủ đề nóng thu hút các nhà nghiên cứu do chủ đề có khả năng áp dụng rộng rãi trong nhiều lĩnh vực. Mô hình phân cụm dựa trên GIS được thiết kế theo cách tiếp cận không giám sát cho phép trích xuất thông tin cụm từ dữ liệu địa lý đã có (ví dụ: tọa độ, nhiệt độ, v.v.) cho các mục đích khác nhau, chẳng hạn như: Phân tích mật độ dân số, phân tích sử dụng đất, phân tích điểm nóng tội phạm, phân tích điểm nóng COVID-19, v.v. Tóm lại, tương tự như mô hình phân cụm không giám sát truyền thống, các kỹ thuật phân cụm được sử dụng để gom các điểm dữ liệu thành các cụm khác nhau dựa trên sự tương đồng của chúng.

Đối với vấn đề phân cụm dựa trên vị trí trong GIS, các phương pháp phân cụm dựa trên mật độ hiện đang gặp phải những khó khăn về chất lượng thấp và nhiễu của thông tin địa lý như tọa độ dẫn đến giảm hiệu suất tổng thể của nhiệm vụ phân cụm dựa trên vị trí.

Ví dụ trong một tình huống có tập dữ liệu không gian địa lý thưa thớt (ví dụ: vị trí của các trường hợp COVID-19 đã được xác nhận hoặc tai nạn, kẹt xe ở các khu vực đô thị, v.v.) mà không có bất kỳ thông tin nào về hình dạng cụm, thông tin địa lý liên quan, ngưỡng khoảng cách, v.v ..., nên khó xác định thông tin cụm từ các tập dữ liệu dựa trên GIS này, cũng như tạo ra các cụm có ý nghĩa cho các nhiệm vụ phân tích tiếp theo.

Nhiều ứng dụng thực tế có thể dùng kết quả này, chẳng hạn như xác định các trường hợp COVID-19 đã được xác nhận hay các điểm nóng trong khu vực cách ly, mật độ tội phạm ở các khu vực cụ thể, mật độ giao thông tại các vị trí cụ thể tại các mốc thời gian khác nhau, v.v.

Thách thức chính của vấn đề phân cụm dựa trên vị trí là tính đại diện thấp của dữ liệu không gian địa lý sẵn có như các tọa độ được dùng để xác định các vị trí địa lý khác nhau, trong đó chỉ cung cấp các giá trị kinh độ và vĩ độ. Vì vậy, thông tin bổ sung là không thể thiếu để cải thiện chất lượng của các biểu diễn dữ liệu dựa trên vị trí. Các biểu diễn này sau đó được sử dụng trực tiếp để tạo điều kiện thuận lợi cho việc triển khai các mô hình phân cụm cũng như tạo ra các cụm có ý nghĩa cho nhiệm vụ phân tích tiếp theo.

Kết quả đạt được:

  • Luận văn đã đề xuất một phương pháp gom cụm dữ liệu vị trí địa lý thông qua hướng tiếp cận khám phá cộng đồng và học máy, mô hình được gọi là CP2Vec.
  • Mô hình CP2Vec được đề xuất nhằm hỗ trợ phân tích và đánh giá mức độ tương đồng giữa các địa điểm. Để làm điều này, luận văn đề xuất một phương pháp xây dựng đồ thị các địa điểm dựa trên mức độ gần nhau của chúng trên không gian địa lý đã được áp dụng.
  • Sau đó, luận văn áp dụng kỹ thuật phát hiện cộng đồng để trích xuất thông tin về các cụm điểm được phân bố gần nhau.
  • Cuối cùng, một kiến trúc mạng nơ-ron đồ thị được áp dụng để học mô hình biểu diễn của các điểm và chuyển đổi thành các vector có số chiều cố định (d). Sau đó các vector biểu diễn các địa điểm được đưa vào các mô hình gom cụm DBSCAN hay HDBSCAN sẵn có để tiến hành gom cụm các địa điểm này.
  • Để chứng minh tính hiệu quả của mô hình được đề xuất cho bài toán gom cụm các địa điểm trong không gian địa lý, luận văn tiến hành thực nghiệm trên các tập dữ liệu thực tế bao gồm hai tập dữ liệu chính.
  • Đầu tiên là tập dữ liệu các địa điểm ca nhiễm COVID-19 được phân bố trong 13 quận của TP. Hồ Chí Minh.
  • Thứ hai là tập dữ liệu về vị trí các vụ án hình sự đã được xảy ra và được báo cáo tại thành phố Hartford, Hoa Kỳ cho nhiệm vụ phân cụm dựa trên vị trí.
  • Kết quả thực nghiệm trong các bộ dữ liệu thực tế này đã chứng minh tính hiệu quả của mô hình CP2Vec được đề xuất của luận văn trong việc nâng cao hiệu suất gom cụm cho các mô hình sẵn có như DBSCAN và HDBSCAN.

Trân trọng.

Xây dựng ứng dụng dự báo chất lượng nước dưới đất dựa vào công nghệ trí tuệ nhân tạo

on .

Xây dựng ứng dụng dự báo chất lượng nước dưới đất dựa vào công nghệ trí tuệ nhân tạo

Phan Thanh Tuấn - CH20020023

Chất lượng asen trong nước tại các vùng đồi núi có thể khác nhau tùy thuộc vào điều kiện địa chất và địa hình của khu vực đó. Các vùng đồi núi thường có nước dưới đất được cung cấp từ các suối, sông và rừng núi. Tuy nhiên, nước dưới đất ở các vùng đồi núi có thể bị ô nhiễm bởi các nguồn gốc tự nhiên như khoáng chất có chứa asen trong đất và đá, hoặc do các hoạt động con người như khai thác mỏ, sử dụng phân bón hóa học, và xả thải từ công nghiệp, gia đình và chăn nuôi.

Các nghiên cứu về chất lượng nước dưới đất tại các vùng đồi núi ở Việt Nam đã chỉ ra sự hiện diện của asen trong nước dưới đất ở mức độ khác nhau. Nhiều vùng đồi núi ở Việt Nam, bao gồm các tỉnh Đắk Nông, Gia Lai, Kon Tum, Lào Cai, Yên Bái, và Hà Giang, đã được phát hiện có nước dưới đất chứa nồng độ asen vượt quá giới hạn cho phép của Tổ chức Y tế Thế giới (WHO) và Bộ Y tế Việt Nam. Tình trạng ô nhiễm asen trong nước dưới đất đã gây ra tác động nghiêm trọng đến sức khỏe của người dân và kinh tế xã hội của khu vực đó.

Do đó, việc đánh giá chất lượng nước dưới đất ở các vùng đồi núi là rất quan trọng để đảm bảo an toàn sức khỏe cho cộng đồng và bảo vệ tài nguyên nước. Các chuyên gia địa chất và môi trường cần thực hiện các nghiên cứu về chất lượng nước dưới đất tại các vùng đồi núi và đưa ra các giải pháp phù hợp để giảm thiểu ô nhiễm asen trong nước.

Kết quả đạt được:

  • Bộ dữ liệu chuẩn với 6 chất Fe, Mn, pH, Hardness, Coliforms EC, gồm 569 bản ghi tương ứng với mỗi chất (trong đó có 398 bản ghi làm dữ liệu huấn luyện và 171 bản ghi làm dữ liệu kiểm chứng).
  • Trong quá trình thực hiện, việc sử dụng các thuật toán máy học đã mang lại khả năng dự báo chất lượng nước dưới đất với độ chính xác cao. Kết quả thử nghiệm cho thấy mô hình SVM đã đạt được hiệu quả tốt nhất trong việc dự báo nồng độ asen trong nước dưới đất, với độ chính xác đạt 90%. Điều này làm rõ tính ứng dụng cao của phương pháp máy học trong việc dự báo chất lượng nước dưới đất.
  • Để mở rộng các nghiên cứu liên quan đến đánh giá và dự báo chất lượng nước dưới đất, có thể khám phá các phương pháp máy học khác như Decision Tree, Random Forest, Neural Networks, và nhiều phương pháp khác. Đồng thời, việc thu thập dữ liệu từ các khu vực khác nhau cũng sẽ đóng góp quan trọng để cải thiện chất lượng dự báo và đánh giá chính xác hơn về tình trạng ô nhiễm asen trong nước dưới đất tại Đắk Nông cũng như các vùng khác.
  • Phân tích và đánh giá bộ dữ liệu các chất trong không khí, tìm hiểu và một số thuật toán máy học dự báo phù hợp với bộ dữ liệu.
  • Hệ thống lưu trữ dữ liệu dự báo asen trong nước dưới đất được xây dựng dưới dạng cơ sở dữ liệu (database) và hệ thống lưu trữ trực tuyến (online storage system). Các thông tin liên quan đến vị trí, độ sâu, nguồn nước và chất lượng nước dưới đất được thu thập và lưu trữ theo thời gian để hỗ trợ việc đánh giá và dự báo chất lượng nước dưới đất trong tương lai.
  • Hệ thống lưu trữ dữ liệu này cần được đảm bảo bảo mật và tính toàn vẹn của dữ liệu. Đồng thời, cần thiết kế hệ thống sao cho có khả năng truy xuất nhanh chóng và dễ dàng dữ liệu, cung cấp các công cụ hỗ trợ phân tích và dự báo dữ liệu cho người dùng.
  • Một số công nghệ lưu trữ dữ liệu phổ biến được sử dụng hiện nay bao gồm cơ sở dữ liệu quan hệ (relational database), NoSQL database, lưu trữ đám mây (cloud storage), hệ thống lưu trữ tập tin (file storage system) và hệ thống lưu trữ đa phương tiện (multimedia storage system). Tuy nhiên, sự lựa chọn phù hợp phụ thuộc vào nhu cầu và yêu cầu của hệ thống dự báo asen trong nước dưới đất.

Trân trọng.