Chào mừng bạn đến với Website NGHIÊN CỨU BÀO CHẾ THUỐC
Rất nhiều ưu đãi và chương trình khuyến mãi đang chờ đợi bạn
Ưu đãi lớn dành cho thành viên mới
  • 5
  • Giỏ hàng

    Không có sản phẩm nào trong giỏ hàng của bạn

18/06/2026
Admin
Hướng Dẫn Sử Dụng MSC XLSX Data Mining

Hướng Dẫn Sử Dụng MSC XLSX Data Mining

Tra cứu, tóm tắt, phân tích và tải file nguồn từ kho dữ liệu msc_xlsx trên Telegram bot

https://t.me/PharmTenderBot - MSC XLSX module

https://t.me/DauThauInfoBot - MSC XLSX module

https://t.me/GiaiPhapDauThauBot - MSC XLSX module

1. Mục Đích

Chức năng MSC XLSX Data Mining giúp người dùng cuối khai thác kho dữ liệu trong thư mục msc_xlsx, là thư mục đồng bộ từ Google Drive. Bot tạo chỉ mục cục bộ từ các file Excel và CSV, sau đó cho phép tìm kiếm, xem tóm tắt, phân tích bằng Gemini và tải lại file nguồn qua Telegram.

2. Khi Nào Cần Dùng

  • Tìm nhanh hồ sơ theo mã IB, tên gói thầu, chủ đầu tư, bên mời thầu hoặc từ khóa chuyên môn.
  • Tóm tắt nội dung chính của một workbook Excel mà không cần mở file thủ công.
  • Phân tích rủi ro, cơ hội, điểm cần đọc kỹ trong hồ sơ bằng Gemini.
  • Tải lại file Excel/CSV gốc từ kho msc_xlsx để kiểm tra chi tiết.
  • Xem thống kê nhanh về lượng dữ liệu đã được bot lập chỉ mục.

3. Quy Trình Sử Dụng Nhanh

  1. Admin hoặc người vận hành chạy /msc_index để tạo hoặc cập nhật chỉ mục dữ liệu.
  2. Người dùng chạy /msc_search để tìm hồ sơ theo từ khóa.
  3. Dùng /msc_summary với mã IB hoặc tên file để xem tóm tắt.
  4. Dùng /msc_analyze nếu cần phân tích sâu bằng Gemini.
  5. Dùng /msc_open để nhận file nguồn khi cần đọc workbook đầy đủ.

4. Các Lệnh Chính

4.1. /msc_index - tạo hoặc cập nhật chỉ mục

Lệnh này quét file Excel/CSV trong msc_xlsx và lưu thông tin cần tìm kiếm vào cache SQLite. Thông thường chỉ admin hoặc người vận hành nên chạy lệnh này vì lần quét đầu có thể mất thời gian.

/msc_index max_files:2000 rebuild:false
Tham sốÝ nghĩaKhuyến nghị
max_filesSố file tối đa bot quét trong lần chạy.Lần đầu dùng 20000 hoặc cao hơn nếu cần.
rebuild:falseGiữ cache cũ, chỉ cập nhật file mới hoặc file đã thay đổi.Dùng hằng ngày hoặc sau khi Drive sync thêm dữ liệu.
rebuild:trueXóa cache cũ và tạo lại từ đầu.Dùng khi cần làm sạch hoặc đổi cấu trúc dữ liệu.

Ví dụ lần đầu tạo chỉ mục đầy đủ:

/msc_index max_files:20000 rebuild:true

Ví dụ cập nhật nhanh sau khi Google Drive có thêm file:

/msc_index max_files:5000 rebuild:false

4.2. /msc_stats - xem thống kê chỉ mục

Lệnh này cho biết bot đã index bao nhiêu tài liệu, loại file nào có trong cache, các nhóm dữ liệu lớn nhất, thời điểm index gần nhất và số lỗi khi đọc file.

/msc_stats
  • Dùng sau /msc_index để xác nhận cache đã có dữ liệu.
  • Nếu total docs bằng 0, cần chạy lại /msc_index.
  • Nếu errors cao, có thể có file đang sync dở, file hỏng hoặc file bị khóa.

4.3. /msc_search - tìm kiếm hồ sơ

Lệnh này tìm trong cache đã index. Có thể tìm theo từ khóa tiếng Việt không dấu hoặc có dấu, mã IB, tên gói thầu, đơn vị mua sắm, chủ đầu tư, trạng thái và nội dung đã trích từ workbook.

/msc_search query:insulin limit:10
/msc_search query:thuốc ung thư category:ms28b_thuoc limit:10
/msc_search query:bệnh viện nhi category:ms42_tu_van limit:5
Tham sốÝ nghĩaVí dụ
queryTừ khóa cần tìm.insulin, vật tư y tế, Bệnh viện Nhi, IB2600199786
categoryGiới hạn trong một nhóm dữ liệu.ms28b_thuoc, ms28a_thiet_bi_y_te_vat_tu_tieu_hao
limitSố kết quả tối đa bot trả về.5, 10, 20

4.4. /msc_summary - tóm tắt một hồ sơ

Lệnh này lấy một hồ sơ theo mã IB hoặc tên file đã được index, rồi trả về thông tin chính như file nguồn, nhóm dữ liệu, tên gói, chủ đầu tư, trạng thái, ngày đăng, danh sách sheet và trích đoạn nội dung.

/msc_summary ib_code:IB2600199786
/msc_summary IB2600199786
  • Dùng sau khi đã tìm thấy mã IB bằng /msc_search.
  • Phù hợp để đọc nhanh trước khi quyết định tải file gốc.
  • Không thay thế việc đọc đầy đủ hồ sơ gốc khi cần ra quyết định quan trọng.

4.5. /msc_analyze - phân tích sâu bằng Gemini

Lệnh này gửi phần nội dung đã index của hồ sơ cho Gemini để phân tích theo câu hỏi của người dùng. Kết quả phù hợp cho định hướng đọc hồ sơ, nhận diện điểm cần chú ý, rủi ro và cơ hội.

/msc_analyze ib_code:IB2600199786 query:phân tích rủi ro và cơ hội tham gia gói này
/msc_analyze ib_code:IB2600199786 query:tóm tắt yêu cầu chính, bên liên quan và điểm cần kiểm tra tiếp

4.6. /msc_open - tải file nguồn

Lệnh này gửi lại file Excel hoặc CSV nguồn qua Telegram. Dùng khi cần mở workbook gốc để kiểm tra chi tiết, đối chiếu sheet hoặc chuyển tiếp cho người khác.

/msc_open ib_code:IB2600199786
/msc_open IB2600199786

5. Nhóm Dữ Liệu Thường Dùng

NhómNội dung thường gặpVí dụ tìm kiếm
ms28b_thuocThuốc./msc_search query:insulin category:ms28b_thuoc limit:10
ms28a_thiet_bi_y_te_vat_tu_tieu_haoThiết bị y tế, vật tư tiêu hao./msc_search query:vật tư y tế category:ms28a_thiet_bi_y_te_vat_tu_tieu_hao limit:10
ms28c_kham_chua_benhDịch vụ khám chữa bệnh./msc_search query:xét nghiệm category:ms28c_kham_chua_benh limit:10
ms28_y_te_thuoc_vat_tu_tieu_haoNhóm y tế tổng hợp./msc_search query:bệnh viện category:ms28_y_te_thuoc_vat_tu_tieu_hao limit:10
ms42_tu_vanDịch vụ tư vấn, bảo trì, bảo dưỡng./msc_search query:bảo trì category:ms42_tu_van limit:10
cuc_quan_ly_duocCSV/tài liệu từ Cục Quản lý Dược./msc_search query:đăng ký thuốc category:cuc_quan_ly_duoc limit:10

6. Mẫu Quy Trình Thực Tế

6.1. Tìm gói thuốc theo hoạt chất

  1. Chạy /msc_search query:insulin category:ms28b_thuoc limit:10.
  2. Chọn mã IB phù hợp trong kết quả.
  3. Chạy /msc_summary ib_code:<mã IB> để xem thông tin chính.
  4. Chạy /msc_analyze ib_code:<mã IB> query:đánh giá rủi ro, cơ hội và điểm cần đọc kỹ.
  5. Chạy /msc_open ib_code:<mã IB> để tải file nguồn nếu cần.

6.2. Tìm hồ sơ thiết bị y tế theo đơn vị mua sắm

  1. Chạy /msc_search query:Bệnh viện Nhi category:ms28a_thiet_bi_y_te_vat_tu_tieu_hao limit:10.
  2. Lọc kết quả theo tên gói hoặc trạng thái.
  3. Dùng /msc_summary để kiểm tra sheet và nội dung chính.
  4. Dùng /msc_open để tải workbook gốc nếu cần xem chi tiết giá, danh mục hoặc yêu cầu kỹ thuật.

7. Cách Đọc Kết Quả

TrườngÝ nghĩa
IBMã thông báo mời thầu hoặc mã E-TBMT nếu workbook có trường này.
NguồnNhóm dữ liệu, tháng, trạng thái thư mục và loại file.
FileĐường dẫn tương đối trong thư mục msc_xlsx.
SheetsDanh sách sheet trong workbook được đọc từ file Excel.
Trích nội dungMột phần nội dung bot đã lấy vào cache để phục vụ tìm kiếm và phân tích.

8. Lỗi Thường Gặp Và Cách Xử Lý

Tình huốngNguyên nhân có thểCách xử lý
Tìm không ra dữ liệu.Chưa chạy index hoặc cache cũ.Chạy /msc_index max_files:20000 rebuild:false rồi tìm lại.
Kết quả thiếu file mới.Google Drive chưa sync xong hoặc chưa cập nhật cache.Đợi Drive sync xong, sau đó chạy /msc_index.
Analyze không có AI.Thiếu GEMINI_API_KEY trong .env.Báo admin kiểm tra key Gemini.
Open không gửi được file.File đã bị đổi tên, di chuyển hoặc Drive chưa tải local.Chạy lại index hoặc mở Drive để đồng bộ file.
Index lâu.Kho dữ liệu lớn, nhiều Excel/PDF/CSV.Dùng max_files thấp để cập nhật từng phần; chạy full index ngoài giờ làm việc.

9. Khuyến Nghị Sử Dụng

  • Luôn chạy /msc_stats sau khi index để kiểm tra tổng số tài liệu và lỗi.
  • Dùng category khi biết nhóm dữ liệu để giảm nhiễu kết quả.
  • Dùng mã IB làm định danh chính khi summary, analyze hoặc open.
  • Với phân tích quan trọng, luôn tải file gốc bằng /msc_open để kiểm chứng.
  • Không đưa dữ liệu nhạy cảm ngoài phạm vi cho phép vào câu hỏi Gemini nếu chính sách nội bộ chưa cho phép.

10. Tóm Tắt Lệnh

LệnhMục đíchVí dụ ngắn
/msc_indexTạo/cập nhật chỉ mục./msc_index max_files:5000 rebuild:false
/msc_statsXem thống kê cache./msc_stats
/msc_searchTìm kiếm hồ sơ./msc_search query:insulin limit:10
/msc_summaryTóm tắt hồ sơ./msc_summary ib_code:IB2600199786
/msc_analyzePhân tích bằng Gemini./msc_analyze ib_code:IB2600199786 query:rủi ro là gì
/msc_openTải file nguồn./msc_open ib_code:IB2600199786