Thiết kế và ứng dụng A.I trong tác vụ xử lý của thiết bị nhà thông minh

Home Automation using Artificial Intelligent & Internet of Things

Lựa chọn đề tài này còn xuất phát từ mong muốn được đóng góp một phần nhỏ bé của mình vào sự phát triển của lĩnh vực nhà thông minh tại Việt Nam. Em nhận thấy rằng, mặc dù nhà thông minh đang là xu hướng phát triển mạnh mẽ trên thế giới, nhưng tại Việt Nam, lĩnh vực này vẫn còn khá mới mẻ và chưa thực sự phát triển tương xứng với tiềm năng. Thông qua việc nghiên cứu và ứng dụng những công nghệ tiên tiến nhất vào đồ án của mình, em hy vọng có thể góp phần thúc đẩy sự phát triển của lĩnh vực nhà thông minh tại Việt Nam, mang những giải pháp công nghệ hiện đại đến gần hơn với người dùng Việt, góp phần nâng cao chất lượng cuộc sống và bắt kịp với xu hướng phát triển chung của thế giới.

TÁC GIẢ

VÕ THÙY DUYÊN

GIẢNG VIÊN HƯỚNG DẪN

NGÀNH

Năm:

Tổng quan đồ án

Sở dĩ em lựa chọn đề tài “Thiết kế và ứng dụng A.I trong tác vụ xử lý của thiết bị nhà thông minh” cho đồ án chuyên ngành của mình xuất phát từ một số lý do chính, mang cả tính cá nhân, học thuật và định hướng tương lai. Cụ thể như sau:

Thứ nhất, đó là niềm đam mê cá nhân đối với công nghệ, đặc biệt là sự giao thoa giữa nhà thông minh và trí tuệ nhân tạo. Em luôn bị cuốn hút bởi những tiến bộ vượt bậc trong lĩnh vực công nghệ và luôn mong muốn được tìm hiểu, khám phá những ứng dụng mới, mang tính đột phá. Em tin tưởng mạnh mẽ rằng sự kết hợp giữa nhà thông minh và trí tuệ nhân tạo chính là chìa khóa mở ra một tương lai đầy hứa hẹn, nơi mà công nghệ thực sự phục vụ con người, nâng cao chất lượng cuộc sống và mang đến những trải nghiệm sống tiện nghi, an toàn và tối ưu hơn bao giờ hết. Niềm đam mê này chính là động lực mạnh mẽ thôi thúc em lựa chọn và theo đuổi đề tài này.

Thứ hai, đề tài này hấp dẫn em bởi tính thực tiễn cao và tiềm năng ứng dụng vô cùng rộng lớn trong tương lai. Trong bối cảnh cuộc sống hiện đại ngày càng trở nên bận rộn, nhu cầu về một không gian sống thông minh, tự động hóa, có thể hiểu và đáp ứng nhu cầu của con người đang ngày càng trở nên cấp thiết. Nhà thông minh, đặc biệt là khi được tích hợp với trí tuệ nhân tạo, đang dần trở thành xu hướng tất yếu, không chỉ mang lại sự tiện nghi, hiện đại mà còn góp phần tối ưu hóa việc sử dụng năng lượng, bảo vệ môi trường, hướng tới một cuộc sống bền vững hơn. Việc nghiên cứu và phát triển các giải pháp ứng dụng AI trong nhà thông minh, do đó, không chỉ mang tính cấp thiết mà còn có tiềm năng ứng dụng rộng rãi, tạo ra những giá trị thiết thực cho xã hội.

Thứ ba, thực hiện đồ án này mang đến cho em cơ hội quý báu để học hỏi, trau dồi kiến thức chuyên môn và phát triển toàn diện các kỹ năng cần thiết. Quá trình nghiên cứu và triển khai đề tài “Thiết kế và ứng dụng A.I trong tác vụ xử lý của thiết bị nhà thông minh” đòi hỏi em phải tìm hiểu sâu rộng về nhiều công nghệ tiên tiến, bao gồm các framework backend như FastAPI, Flask, hệ quản trị cơ sở dữ liệu SQLite, và đặc biệt là các mô hình trí tuệ nhân tạo hiện đại như Speech-to-Text (chuyển đổi giọng nói thành văn bản), Text-toSpeech (chuyển đổi văn bản thành giọng nói) và mô hình ngôn ngữ lớn Gemini sau khi được tinh chỉnh (Finetuned). Bên cạnh đó, em còn có cơ hội rèn luyện và nâng cao các kỹ năng quan trọng khác như kỹ năng lập trình, thiết kế và triển khai hệ thống, giải quyết vấn đề, tư duy logic, làm việc độc lập và kỹ năng tự học hỏi, nghiên cứu. Tất cả những kiến thức và kỹ năng này sẽ là nền tảng vững chắc cho sự nghiệp của em trong tương lai.

Cuối cùng, lựa chọn đề tài này còn xuất phát từ mong muốn được đóng góp một phần nhỏ bé của mình vào sự phát triển của lĩnh vực nhà thông minh tại Việt Nam. Em nhận thấy rằng, mặc dù nhà thông minh đang là xu hướng phát triển mạnh mẽ trên thế giới, nhưng tại Việt Nam, lĩnh vực này vẫn còn khá mới mẻ và chưa thực sự phát triển tương xứng với tiềm năng. Thông qua việc nghiên cứu và ứng dụng những công nghệ tiên tiến nhất vào đồ án của mình, em hy vọng có thể góp phần thúc đẩy sự phát triển của lĩnh vực nhà thông minh tại Việt Nam, mang những giải pháp công nghệ hiện đại đến gần hơn với người dùng Việt, góp phần nâng cao chất lượng cuộc sống và bắt kịp với xu hướng phát triển chung của thế giới.

Cơ sở lý thuyết

Học máy (Machine Learning)

Học máy là một nhánh của Trí tuệ nhân tạo (AI), tập trung vào việc phát triển các thuật toán cho phép máy tính “học” từ dữ liệu mà không cần được lập trình cụ thể. Thay vì dựa trên các quy tắc được định nghĩa trước, các mô hình học máy tự động nhận diện các mẫu (pattern) trong dữ liệu và sử dụng các mẫu này để đưa ra dự đoán hoặc quyết định.

Mô hình ngôn ngữ lớn (Large Language Models – LLMs):

Khái niệm: Là các mô hình học máy, thường dựa trên kiến trúc Transformer, được huấn luyện trên lượng dữ liệu văn bản khổng lồ (hàng tỷ, hàng nghìn tỷ từ), có khả năng hiểu và sinh ra ngôn ngữ tự nhiên một cách ấn tượng, gần giống với con người.

Kiến trúc Transformer:
o Giới thiệu: Kiến trúc mạng nơ-ron được giới thiệu trong bài báo “Attention is All You Need” (Vaswani et al., 2017), sử dụng cơ chế self attention để xử lý các chuỗi dữ liệu.
o Self-Attention: Cho phép mô hình tập trung vào các phần quan trọng nhất của đầu vào khi xử lý một từ trong chuỗi, nắm bắt được mối quan hệ giữa các từ trong câu, bất kể khoảng cách giữa chúng.
o Ưu điểm: Xử lý song song hiệu quả, nắm bắt được các mối quan hệ xa trong chuỗi, khả năng mở rộng tốt.

Tinh chỉnh mô hình (Fine-tuning)

Khái niệm: Là quá trình huấn luyện thêm một mô hình đã được huấn luyện trước (pretrained model) trên một tập dữ liệu nhỏ hơn, chuyên biệt hơn cho một tác vụ cụ thể.

Mục đích:
o Tận dụng kiến thức: Mô hình pre-trained đã học được các đặc trưng (features) hữu ích từ tập dữ liệu lớn, tổng quát. Fine-tuning giúp chuyển giao (transfer) kiến thức này sang tác vụ cụ thể.
o Cải thiện hiệu suất: Fine-tuning giúp mô hình đạt hiệu suất cao hơn trên tác vụ cụ thể so với việc huấn luyện từ đầu.
o Tiết kiệm thời gian và tài nguyên: Huấn luyện từ đầu một mô hình lớn đòi hỏi nhiều thời gian, dữ liệu và tài nguyên tính toán. Fine-tuning giúp giảm đáng kể chi phí này.

Tổng quan về hệ thống

Giới thiệu về Nhà thông minh (Smarthome)

Nhà thông minh (Smarthome) đang dần trở thành một khái niệm quen thuộc và là xu hướng phát triển tất yếu trong kỷ nguyên công nghệ 4.0. Về cơ bản, nhà thông minh là một hệ thống tích hợp các thiết bị điện tử, điện gia dụng và các hệ thống khác trong ngôi nhà, cho phép chúng kết nối, giao tiếp và tương tác với nhau thông qua mạng internet. Mục tiêu chính của nhà thông minh là mang đến sự tiện nghi, an toàn, tiết kiệm năng lượng và nâng cao chất lượng cuộc sống cho người sử dụng.

Hệ thống nhà thông minh thường bao gồm các thành phần chính như:

  • Các thiết bị thông minh (Smart Devices): Bao gồm các thiết bị điện tử, điện gia dụng được tích hợp khả năng kết nối mạng như đèn thông minh, công tắc thông minh, ổ cắm thông minh, điều hòa thông minh, tivi thông minh, cảm biến nhiệt độ, cảm biến độ ẩm, cảm biến chuyển động, camera an ninh, v.v.
  • Bộ điều khiển trung tâm (Hub/Gateway): Là “bộ não” của hệ thống, có nhiệm vụ kết nối và điều phối hoạt động của các thiết bị thông minh trong nhà.
  • Hệ thống mạng: Thường sử dụng các giao thức kết nối không dây như Wi-Fi, Zigbee, Z-Wave, Bluetooth để kết nối các thiết bị thông minh với bộ điều khiển trung tâm và internet.
  • Ứng dụng điều khiển (App/Interface): Cung cấp giao diện tương tác cho phép người dùng giám sát, điều khiển và thiết lập các thiết bị thông minh từ xa thông qua điện thoại thông minh, máy tính bảng hoặc các thiết bị chuyên dụng khác.

Giới thiệu Hệ thống Nhà thông minh trong Đồ án

Trong khuôn khổ đồ án này, em tập trung xây dựng một hệ thống nhà thông minh có khả năng điều khiển các thiết bị điện trong nhà, mà cụ thể là tập trung vào hệ thống đèn chiếu sáng, thông qua giọng nói của người dùng. Hệ thống được thiết kế với mục tiêu mang đến sự tiện lợi, dễ dàng trong việc điều khiển các thiết bị, đồng thời hướng đến khả năng học hỏi và thích ứng với thói quen của người sử dụng trong tương lai.

Điểm nổi bật của hệ thống là việc ứng dụng các mô hình AI để xử lý ngôn ngữ tự nhiên, cho phép người dùng tương tác với các thiết bị một cách trực quan và thuận tiện nhất. Thay vì phải thao tác trên các ứng dụng hay công tắc vật lý, người dùng có thể ra lệnh bằng giọng nói để bật/tắt đèn, điều chỉnh độ sáng, thay đổi màu sắc (nếu đèn hỗ trợ), v.v.

Chi tiết về kiến trúc, quy trình hoạt động, các công nghệ và mô hình AI được sử dụng sẽ được trình bày cụ thể trong các chương tiếp theo.

Mã nguồn và video demo
Để có cái nhìn trực quan và chi tiết hơn về hệ thống, quý thầy cô và các bạn có thể tham khảo mã nguồn của đồ án tại địa chỉ: https://github.com/DUYEN2809/SmartHome-IoT.

Bên cạnh đó, em cũng đã chuẩn bị một video demo ngắn, giới thiệu các tính năng cơ bản của hệ thống và cách thức hoạt động thực tế. Quý thầy cô và các bạn có thể xem video tại đường dẫn: https://drive.google.com/file/d/18WDsygihvo3cKyeTXG6xVOOpM9ynwr_i/view?usp
=sharing.

Kiến trúc hệ thống

image 22
image 23
image 24

Kết luận

1. Điểm mạnh

Hệ thống nhà thông minh điều khiển bằng giọng nói được xây dựng trong đồ án này sở hữu kiến trúc phân tán, chia thành hai thành phần chính: API Server và Local Server.

Kiến trúc này mang lại nhiều lợi ích, có thể kể đến như:

  • API Server (Server A.I): Đảm nhiệm các tác vụ nặng, đòi hỏi nhiều tài nguyên tính toán và cần cập nhật liên tục, đặc biệt là các tác vụ liên quan đến trí tuệ nhân tạo (AI) như nhận dạng giọng nói (Speech-to-Text), xử lý ngôn ngữ tự nhiên (Natural Language Processing) và tổng hợp giọng nói (Text-to-Speech). Việc tập trung các tác vụ AI vào một server riêng biệt giúp:
    o Tối ưu hóa hiệu năng: Server có thể được trang bị cấu hình mạnh mẽ, chuyên dụng cho các tác vụ AI, đảm bảo hiệu năng xử lý cao.
    o Dễ dàng cập nhật và bảo trì: Việc cập nhật, nâng cấp các mô hình AI, thư viện, framework được thực hiện tập trung, không ảnh hưởng đến các thành phần khác của hệ thống.
    o Chia sẻ tài nguyên: API Server có thể được sử dụng bởi nhiều hệ thống Local Server khác nhau, giúp tiết kiệm chi phí đầu tư và vận hành.
  • Local Server: Chịu trách nhiệm quản lý cơ sở dữ liệu (CSDL) người dùng và thiết bị, xử lý các tác vụ trong mạng nội bộ (LAN) và giao tiếp với các thiết bị IoT. Thiết kế này mang lại các ưu điểm:
    o Bảo mật: CSDL và các thông tin nhạy cảm được lưu trữ và xử lý trong mạng nội bộ, hạn chế các nguy cơ tấn công từ internet.
    o Độ trễ thấp: Việc xử lý các tác vụ trong mạng nội bộ diễn ra nhanh chóng, mang lại trải nghiệm tốt hơn cho người dùng.
    o Tiết kiệm tài nguyên: Local Server có thể sử dụng các thiết bị có cấu hình thấp, tiết kiệm chi phí đầu tư.
    Kiến trúc này còn mang lại khả năng tùy biến và nhân bản dễ dàng, phù hợp cho việc triển khai đại trà và phát triển thành sản phẩm thương mại.
    Về mặt hiệu năng, hệ thống đã đáp ứng được các yêu cầu đặt ra cho tác vụ nhà thông minh kết hợp AI. Các tác vụ nhận dạng giọng nói và tổng hợp giọng nói được thực hiện gần như tức thời (real-time) trên API Server với cấu hình:
  • GPU: NVIDIA Geforce RTX 4060
  • CPU: Intel(R) Core(TM) i5-14400F
  • RAM: 32 GB
    Điều này cho thấy việc lựa chọn các mô hình AI (PhoWhisper-small, mms-tts-vie) và framework (FastAPI) là phù hợp.

2. Điểm yếu

Điểm hạn chế của hệ thống hiện tại nằm ở mô hình Gemini Finetuned. Do sử dụng phiên bản miễn phí, thời gian phản hồi của mô hình này còn chậm (khoảng 2-3 giây), ảnh hưởng đến trải nghiệm người dùng. Để khắc phục, cần nâng cấp lên các mô hình mạnh mẽ hơn như Gemini Advanced hoặc GPT-4, tuy nhiên điều này sẽ làm tăng chi phí vận hành.

3. Hướng Phát Triển

Trong tương lai, đồ án có thể được phát triển và hoàn thiện theo các hướng sau:

  • Bảo mật:
    o Tăng cường bảo mật cho Local Server: Triển khai các biện pháp bảo mật như xác thực người dùng (authentication), phân quyền truy cập (authorization), mã hóa dữ liệu (encryption) để bảo vệ CSDL và các thông tin nhạy cảm.
    o Config hệ thống IoT: Cho phép người dùng cấu hình các thiết bị IoT một cách an toàn, ví dụ: thay đổi mật khẩu Wi-Fi, thiết lập quyền truy cập.
  • Mở rộng và Tùy biến:
    o Đóng gói thiết bị: Chuẩn hóa giao tiếp giữa Local Server và thiết bị IoT, đóng gói các thiết bị thành các module (ví dụ: module đèn, module quạt, module cảm biến) để dễ dàng thêm, bớt, thay thế thiết bị.
    o Tùy biến cho người dùng cuối:
    ▪ Cung cấp giao diện cho phép người dùng tự thêm, cấu hình thiết bị và kịch bản (automation) một cách dễ dàng.
    ▪ Cá nhân hóa mô hình Gemini: Cho phép người dùng tự tinh chỉnh (finetune) mô hình Gemini dựa trên dữ liệu và thói quen sử dụng của họ, giúp hệ thống hoạt động thông minh và cá nhân hóa hơn.
  • Trải nghiệm người dùng:
    o Cải thiện giao diện web: Thiết kế giao diện web trực quan, thân thiện và dễ sử dụng hơn, có thể hiển thị sơ đồ bố trí nhà (floor plan) và vị trí các thiết bị.
    o Thiết bị “nghe và phản hồi” chuyên dụng: Phát triển một thiết bị phần cứng chuyên dụng, tích hợp microphone (có tính năng wake-word như “OK Google”) và loa, đóng vai trò như một “trợ lý ảo” trung tâm, giúp người dùng tương tác với hệ thống một cách tự nhiên và thuận tiện hơn.
    o Phát triển ứng dụng di động: Xây dựng ứng dụng di động (mobile app) với đầy đủ tính năng như phiên bản web, cho phép người dùng điều khiển và giám sát hệ thống từ xa một cách an toàn và bảo mật.