Pages

21 thg 6, 2011

Một số thuật ngữ về Machine Learning

Bài này tôi trình bày một vài khái niệm cơ bản về học máy (Machine Learning) với mục đích phục vụ cho quá trình tìm hiểu về Data Mining.


Training data là một cặp đối tượng (dạng vector) gồm đầu vào và đầu ra tương ứng mong muốn.

Training set là tập các training data



(to be continue...)

Supervised learning - Học có giám sát

Supervised learning (học có giám sát)là một kỹ thuật trong Machine Learning có ứng dụng phổ biến trong các phân ngành Computer Science (đặc biệt là Data Mining).


Thuật toán supervised learning sẽ đảm bảo với một input bất kỳ thì luôn cho một output-phù-hợp tương ứng. Vấn đề ở đây là làm sao để thuật toán Supervised learning có thế đưa ra được output tương-đối-chuẩn-xác?! Một cách khái quát,thuật toán sẽ dựa vào tập dữ liệu huấn luyện (training set) cho trước, xây dựng trên tập đó một ánh xạ f (hàm f) input-output, và sau đó, khi đưa một input bất kỳ vào, thuật toán sẽ dự đoán output tương ứng (mấu chốt ở đây là dự đoán - predict ). Như vậy, output này sẽ rất khó đạt tới mức hoàn hảo (100%), nên tất hẳn tồn tại một hàm xác suất để đánh giá độ chuẩn xác của thuật toán supervised learning! Cần nói thêm về ánh xạ f, bản chất của nó là hàm phân lớp (classification) các dữ liệu huấn luyện, sau đó, khi có input, nó sẽ dựa căn cứ vào việc matching class-input để tìm ra được class phù hợp với input, từ đó đưa ra được output-phù hợp. Ánh xạ f được chia làm hai loại: classifier function ứng với output là thông tin rạc, và regression function (hàm hồi quy) nếu output là thông tin liên tục.

Sách 1: Uốn lưỡi bảy lần trước khi nói


Quyển đầu tiên mình review, "Uốn lưỡi bảy lần trước khi nói". Đây là cuốn sách do bạn mình, TrườngLX, đang làm cộng tác viên cho một nhà sách giới thiệu và cho mình mượn đọc, hi, mấy tuần rồi chưa trả.

Ban đầu, đó là một cuốn sách hay về nghệ thuật sử dụng ngôn từ trong thời buổi giao tiếp làm nền này (mặc dù, đây là sách dịch nên văn hóa cư xử của phương Tây có khác đôi chút so với xã hội mình đang tiếp xúc). Sách gồm một số chương nói về cách sử dụng từ ngữ tích cực (chương XX), cách nâng cao giá trị bản thân qua lời nói (chương YY),

Một khía cạnh nào đó, nếu dùng những câu mang tính khẳng định vấn đề sẽ tốt hơn một câu phủ-định-để-khẳng-định. Trong sách có nói một ví dụ, có một va chạm giữa 2 người:
A: Anh đã ném nó vào tôi. (nó ở đây là tờ 10$)
B: Tôi không ném nó. Đó là do gió thổi! (sự thật đúng là gió thổi)
Sau đó là một hồi cãi nhau, cuối cùng, cả 2 chỉ mang nỗi bực dọc vào người. Người ta đề xuất thế này, nếu B nói "Xin lỗi, chỉ là do gió thổi", thì chắc chắn rằng, cả hai sẽ nở nụ cười khi tạm biệt nhau. Vậy đấy, khẳng định một điều chắn chắn, thì tốt hơn là phủ nhận nó để đưa ra sự thật. Tất nhiên rồi, đi đường thẳng (nói luôn ra sự thật) sẽ tốt hơn đi đường vòng (phủ nhận rồi mới đưa ra sự thật).

(continue)

Lan man về IT

Dạo này mình tự dưng thích đọc mấy cái linh tinh về công nghệ thông tin. Cả chiều qua ở trong mớ hỗn độn những blog của các super với toàn mật mã (cryptography), hacker , tội phạm mạng , rắc rối hóa code (Obfuscation) và giờ là cả Ruby on Rails . Chẳng biết mình muốn đi tìm cái gì nữa, đọc xong thấy cái nào cũng hay, cũng hấp dẫn, và... cũng có ứng dụng, tất nhiên, thấy cái nào cũng ra $$$ cả!!! Có lẽ cái gì cũng đọc mà chẳng cái nào ra hồn mất thôi. Một chút, thấy hacking cũng hay phết, tính mình tò mò, muốn lò dò vào máy em này em kia xem có gì hay không, hehe, muốn mò mẫm vào máy mấy em cùng mạng ở nhà xem có gì thú vị không, và muốn dò vào một site bank nào đó, chuyển vào account của mình, hehehehe ( từ nãy tới giờ, đùa đấy, :) ). Nào thì cài trojan mở port, nào thì telnet gì gì đó, chả nhớ, vì chưa làm, mà cũng chẳng chắc dám làm, nhưng, thấy thú vị thật, dù đó chỉ là basic, --không biết advance thì còn nhiều trò hay thế nào nhỉ!? Rồi tới Rắc rối hóa code , lúc mới đầu đọc thấy một cuộc thi về trò này, mình bảo dở hơi hay sao, người ta đang cố clear code, thì lại đâm đầu vào confuse nó. Nhưng đọc tiếp thì thấy quả là tuyệt vời, một phương pháp hiding-code thật hay mà đảm bảo không ảnh hưởng quá nhiều tới hiệu năng của đoạn code mình viết ra, một phương pháp phát hiện sao chép phần mềm, và cũng là một phương pháp ứng dụng trong việc mã hóa công khai ( PKC ).
Về Ruby on Rails (RoRs), mình mới chỉ biết được nó là một nền tảng phát triền web nhanh, có thể mình sẽ được tiếp xúc vào hè này với một superman về mảng này, anh CodeMonkey. Để xem mình có biết được chút gì từ siêu nhân này không, :).

My dream, :)


Hihi, per month!!!

20 thg 6, 2011

Giới thiệu về thú đọc sách

Thư giãn một chút, mình bắt đầu thấy thích đọc sách! Phải chăng vì một người thầy say mê đọc sách (y là Hồ Đồ lãng tử), phải chăng vì một cậu bạn cũng đang say mê đọc sách và rủ rê mình, và phải chăng, tiềm thức trong mình trỗi dậy sau nhiều năm ngủ mê!
Xưa, khi còn bé, chắc tầm lớp 2 lớp 3 (cái lúc mà bắt đầu đọc thông), mẹ hay mang về nhà cho mình báo thiếu niên. Khi đó, đọc ham tới nỗi đọc đi đọc lại một tờ báo. Cứ mỗi tuần một quyển báo như thế. Được một thời gian thì mẹ mượn về cho mình sách (vì trường mẹ khi đó thư viện lớn, nhiều sách), nói chung là đủ thể loại tạp nham (nói nhỏ, may mà không có cái kiểu sách 18+ như bây giờ, ;)), nhưng chủ yếu là sách văn học và truyện đô-rê-mon (chính vì lý do này nên tới bây giờ, loại truyện tranh dài kỳ duy nhất mà mình đọc là đô-rê-mon), cũng có vài quyển khác (Siêu quậy Teppy, Người máy Hamman, Conan, 1 truyện nữa cực hay về bọn đầu trọc và điệp vụ Nga, chả nhớ tên). Một quyển mà mình nhớ nhất là "Tuyển tập 400 câu chuyện cổ tích", nhưng không phải của thư viện, của 1 cô thực tập sinh ở trường mẹ (chắc bằng tuổi mình bây giờ, nói nhỏ, cô xinh lắm, lại dân Hà Nội nữa, hức, giờ thì chả có cô thực tập sinh nào nữa....). Quyển cổ tích đó đọc sướng mê tơi luôn, dày cộp, mình làm gối ngủ, :), đọc như được rơi vào xứ sở thần tiên ấy!!! Sau đó một thời gian thì mẹ chuyển về trường gần nhà, trường mới nên chẳng có sách, hic, từ đầy chẳng có sách mà đọc. À, phải kể tới nhà ông ngoại nữa, ông mê sách, hồi bao cấp, lương chẳng đủ ăn, nhưng tháng nào ông cũng tiết kiệm mua được một cuốn sách. Hồi đó mẹ cũng ra mượn ông mấy quyển, "Đất nước Angiép" (quyển này khó hiểu, vì toàn số với căn bậc 2, lớp 3 thì bít gì cái này), "Chú bé Ticolo" (quyển này cũng không đọc hết, vì dày quá, :( ). Sách của ông, mình đọc được mỗi "sự tích tây nguyên","số đỏ" (:)).
Cấp 2 thì không động tới sách nữa....
Cấp 3 gặp 2 đứa bạn, thích đọc sách kiểu Hạt giống tâm hồn nên mình cũng đọc cùng, thấy cũng hay, chiêm nghiệm và ....teen.
Đại học, chẳng còn đọc sách nữa, thành phố nhiều điều thú vị hơn....
Và giờ đây, cám ơn TrườngLX đã khơi lại thói quen đã bị bỏ lâu quá rồi của mình. Thực sự, cám ơn cậu nhiều!
Mình sẽ cố gắng đọc và note những gì mình cảm nhận được ở từng cuốn sách, để không bị phôi pha, quên lãng về sau!

Come back...

    Bẵng đi một thời gian bị mất tài khoản....
Giờ mình trở lại, thôi thì cố gắng design cho cái mặt nó ổn ổn tý để khi lần ra lần vào còn dễ dàng. Nhưng mà, chả biết design thế nào nữa, lần mò mãi mà cái mặt vẫn như không hồn. Chắc mình chả duyên phận gì với anh TKW rồi!!!:(. (Đang chuyển hướng ngâm cứu Server, :)).)
    Giờ viết gì đây, với cái tháng 6 này?! Cả đời này chắc mình nhớ tháng 6 nhất thôi, vì cứ tới cái tháng này là cảm xúc cứ gọi là rủng rỉnh, dùng mãi không hết. Nào thì thi, nào thì chuyện ấy ơi ấy à, nào thì chuyện ấy à ấy ơi, lắm quá, lung tung beng cả lên. Rốt cục, mình chả được cái gì, và , cũng chả làm được cái gì nốt. Phủi!


Hè này lại một mớ dự định. Hic, sao mãi không tỉnh người ra, cả năm này, lúc nào cũng ôm đồm, rồi chả ra cái gì cả, hỏng hết cả một thân người, mà, có nào được gì đâu! Biết mà không sửa, người ta bảo ngu. Sửa mà không biết sửa sao, người ta bảo dốt! Tóm cho cùng cực, là ngu dốt người ơi! Chài, cuộc sống mến thương quá!

Tự dưng đứt mạch chém gió, thôi để đó, thi xong cái em chuối này thì ta tính tiếp! Dù sao thì cuộc sống vẫn mến thương, :)), (Galile ver.2)