Tổng quan đồ án
Trong thời đại công nghệ số bùng nổ, mạng xã hội đã trở thành nền tảng quan trọng để kết nối, chia sẻ và cập nhật thông tin. Các xu hướng thông tin (trending topics) không chỉ phản ánh nhịp sống xã hội mà còn ảnh hưởng sâu rộng đến nhiều lĩnh vực, từ kinh tế, văn hóa, đến đời sống cá nhân. Tuy nhiên, sự phát triển nhanh chóng của mạng xã hội đồng thời cũng tạo ra một thách thức lớn: không phải ai cũng có khả
năng tiếp cận hoặc theo kịp những xu hướng này.
Đặc biệt, một bộ phận người dùng ít sử dụng mạng xã hội hoặc có lối sống “lowkey” thường không khai thác đầy đủ các nền tảng thông tin đa dạng, dẫn đến sự hạn chế trong việc tiếp cận các xu hướng quan trọng. Điều này đặt ra nhu cầu cấp thiết về một hệ thống hỗ trợ cập nhật thông tin xu hướng một cách tự động, chính xác, và dễ tiếp cận, bất kể mức độ tương tác với mạng xã hội của người dùng.
Với mong muốn đáp ứng nhu cầu này, đề tài tập trung vào việc xây dựng một hệ thống thu thập và tổng hợp thông tin xu hướng từ nhiều nguồn khác nhau. Hệ thống không chỉ giúp người dùng nắm bắt nhanh chóng các sự kiện nổi bật mà còn mở rộng phạm vi tiếp cận thông tin đến những đối tượng ít sử dụng mạng xã hội. Đây là một giải pháp thiết thực và phù hợp với bối cảnh xã hội hiện nay, góp phần thu hẹp khoảng cách thông tin và tối ưu hóa lợi ích từ sự phát triển của mạng xã hội.
Với tính cấp thiết và ý nghĩa thực tiễn cao, đề tài hứa hẹn mang lại những đóng góp quan trọng cả về mặt lý thuyết lẫn ứng dụng trong lĩnh vực công nghệ thông tin và truyền thông.
Mục tiêu thực hiện đề tài
Đề tài hướng đến mục tiêu xây dựng một hệ thống tự động thu thập, phân tích và xử lý thông tin xu hướng từ các nền tảng đáng tin cậy, nơi thường xuyên đăng tải các nội dung cập nhật và phản ánh những sự kiện, chủ đề nổi bật.
Hệ thống sẽ tập trung vào việc thu thập dữ liệu liên quan đến các hashtag, cụm từ tìm kiếm, và các nội dung xu hướng phổ biến, từ đó tiến hành phân tích nhằm xác định các xu hướng chính yếu và có giá trị đối với người dùng. Một trong những trọng tâm của đề tài là đảm bảo khả năng cập nhật dữ liệu theo thời gian thực (real-time), giúp người dùng luôn tiếp cận thông tin một cách nhanh chóng, chính xác, và kịp thời. Việc này không chỉ đáp ứng nhu cầu theo dõi xu hướng tức thời mà còn tối ưu hóa trải nghiệm người dùng trong bối cảnh lượng thông tin khổng lồ được tạo ra mỗi ngày trên không gian mạng.
Đồng thời, đề tài đặt mục tiêu phát triển một giao diện website thân thiện, trực quan và dễ sử dụng, cho phép hiển thị thông tin xu hướng một cách rõ ràng, hệ thống. Giao diện này sẽ tích hợp các chức năng tìm kiếm và theo dõi xu hướng, tạo điều kiện thuận lợi để người dùng dễ dàng tiếp cận, nắm bắt, và khai thác thông tin phục vụ nhu cầu cá nhân hoặc chuyên môn.
Kết quả mong đợi của đề tài là một giải pháp công nghệ hữu ích, vừa có giá trị ứng dụng thực tiễn cao, vừa đóng góp thiết thực vào việc tận dụng tiềm năng của dữ liệu xu hướng trong kỷ nguyên số.
Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài bao gồm
- Các thông tin xu hướng được đăng tải trên các nền tảng mạng xã hội và trang thông tin đáng tin cậy như Twitter, Facebook, YouTube, Google Trends, và các nguồn thông tin trực tuyến khác.
- Các thuật toán và phương pháp phân tích dữ liệu xu hướng, bao gồm xử lý ngôn ngữ tự nhiên (NLP), khai thác dữ liệu (data mining), và cập nhật dữ liệu thời gian thực (real-time data processing).
- Hành vi và nhu cầu của người dùng đối với việc theo dõi và tiếp cận thông tin xu hướng.
Phạm vi nghiên cứu
- Phạm vi nội dung: Nghiên cứu tập trung vào việc thu thập, phân tích và xử lý các nội dung xu hướng như hashtag, từ khóa, cụm từ, và các sự kiện nổi bật từ các nguồn thông tin trực tuyến đáng tin cậy.
- Phạm vi kỹ thuật: Đề tài giới hạn trong việc xây dựng hệ thống dựa trên nền tảng web, với các chức năng chính bao gồm thu thập dữ liệu tự động, phân tích xu hướng, hiển thị thông tin, và cung cấp khả năng tìm kiếm. Các công nghệ và ngôn ngữ lập trình như Python, JavaScript, HTML/CSS, và các công cụ xử lý dữ liệu sẽ được áp dụng.
- Phạm vi người dùng: Hướng đến nhóm người dùng có nhu cầu cập nhật thông tin xu hướng nhanh chóng, bao gồm cả những người ít sử dụng mạng xã hội hoặc không quen thuộc với các nền tảng thông tin phổ biến.
Đề tài tập trung vào phát triển một hệ thống có tính ứng dụng thực tiễn cao, với khả năng đáp ứng nhu cầu theo dõi và khai thác thông tin xu hướng một cách hiệu quả, chính xác, và tiện lợi trong bối cảnh xã hội số hiện nay.
Phân tích và thiết kế
1. Phân tích yêu cầu chức năng
Người dùng
- Đăng ký và đăng nhập vào tài khoản.
- Xem danh sách rút gọn các tìm kiếm, hashtag, bài viết, video đang trên xu hướng ở trang chủ website (dựa vào lượt tìm kiếm, số lần sử dụng, lượt đồng tình/không đồng tình, số lượt xem, số lượt like,…).
- Xem danh sách đầy đủ các đối tượng xu hướng được quan tâm nhất của từng mục tìm kiếm, hashtag, bài viết, video ở các trang tương ứng trên website (có thể xem lại lịch sử danh sách trong 24 tiếng).
- Gửi mail góp ý thông qua biểu mẫu ở cuối trang chủ.
Quản trị viên
- Đăng nhập vào tài khoản quản trị viên.
- Quản lí danh sách tài khoản người dùng: Thêm , xóa , sửa các tài khoản người dùng tùy theo chính sách.
Hệ thống tự động
- Lấy dữ liệu (thông qua API hoặc HTML).
- Lập lịch với Cron Job để cứ 2 giờ thì các dữ liệu sẽ được cập nhật mới, những dữ liệu cũ cũng sẽ được lưu trữ lại trong vòng 24 giờ nhằm phục vụ nhu cầu người xem.
2. Sơ đồ hệ thống





3.3. Thiết kế giao diện người dùng

Kết quả




Kết luận
Tóm tắt nội dung đã thực hiện được
- Tích hợp đa dạng kỹ thuật thu thập dữ liệu: Nhóm đã kết hợp linh hoạt nhiều phương pháp thu thập dữ liệu khác nhau, bao gồm sử dụng API và trích xuất HTML. Điều này giúp hệ thống đảm bảo được tính chính xác và đầy đủ của dữ liệu, đồng thời tối ưu hóa khả năng thu thập thông tin từ các nguồn khác nhau một cách hiệu quả.
- Cung cấp thông tin xu hướng đa dạng: Hệ thống mang đến cho người dùng một kho thông tin phong phú, từ các xu hướng xã hội, giải trí, âm nhạc đến bài báo thịnh hành. Các thông tin được hiển thị một cách rõ ràng và trực quan, không chỉ giúp người dùng dễ dàng nắm bắt xu hướng mà còn tăng tính hấp dẫn trong trải nghiệm sử dụng.
- Người dùng có thể xem và theo dõi các xu hướng theo các mốc thời gian trong ngày. Theo dõi các lịch sử hiển thị của xu hướng.
- Giao diện thân thiện và trực quan: Nhóm đã thiết kế giao diện với các mục được phân chia cụ thể, rõ ràng và dễ sử dụng. Điều này mang lại trải nghiệm mượt mà, thân thiện, giúp người dùng nhanh chóng tìm kiếm và tiếp cận nội dung mong muốn.
- Cập nhật dữ liệu theo thời gian thực (real-time): Hệ thống hỗ trợ cập nhật thông tin liên tục và nhanh chóng, giúp người dùng nhận được phản hồi và thông tin mới nhất trong thời gian ngắn nhất. Đây là một điểm mạnh lớn, nâng cao giá trị sử dụng của hệ thống
Hướng phát triển
Phát triển tính năng tương tác người dùng: Nhóm dự định tích hợp thêm các tính năng tương tác, cho phép người dùng tham gia đóng góp nội dung, lưu trữ hoặc đánh dấu các thông tin quan trọng. Điều này sẽ nâng cao trải nghiệm người dùng, giúp họ không chỉ đơn thuần tiếp nhận thông tin mà còn có thể quản lý và sử dụng dữ liệu theo nhu cầu cá nhân.
Bổ sung thông tin chi tiết và phân tích xu hướng: Nhóm muốn phát triển thêm các chức năng cung cấp thông tin chi tiết cho từng xu hướng. Ví dụ, hệ thống có thể hiển thị các thống kê liên quan, so sánh sự thay đổi của xu hướng qua các năm hoặc các giai đoạn khác nhau, giúp người dùng có cái nhìn toàn diện và sâu sắc hơn về nội dung quan tâm.
Lưu trữ và hiển thị dữ liệu theo thời gian: Một tính năng mới mà nhóm mong muốn triển khai là khả năng lưu trữ dữ liệu trên web. Tính năng này cho phép người dùng xem lại các xu hướng đã xảy ra trong khoảng thời gian cụ thể, như 7 ngày trước hoặc 1 giờ trước, từ đó giúp họ nắm bắt thông tin không chỉ trong thời gian thực mà còn cả lịch sử biến động của xu hướng.


