Tuesday, December 31, 2024

12/31/2024 跨年夜

Happy New Year

Monday, December 30, 2024

Vision Model

YOLOv9

YOLO (You Only Look Once) v9 是一個深度學習物件偵測模型系列的最新版本。

主要特點:

  • 比舊版本如 YOLOv8 更快、更準確
  • 改進的主幹網路架構,增加了模型對物體的識別能力
  • 更高效的資源利用,可以在較低配置的設備上運行
  • 更好的小物件偵測能力

應用場景:

  • 即時影像監控和分析
  • 自動駕駛車輛的物件識別
  • 工業生產線的品質檢測
  • 醫學影像分析
  • 智慧零售中的商品識別

這種技術之所以叫「You Only Look Once」,是因為它只需要看一次圖片就能同時:

  1. 定位出物件在圖片中的位置 (用邊界框標示)
  2. 辨識出物件的類別 (例如是人、車、貓等)
  3. 計算出辨識結果的信心分數


LLaVA是一個多模態AI模型,它結合了:

  1. 視覺編碼器(Vision Encoder):
  • 使用Vision Transformer (ViT)架構
  • ViT將圖像分割成小塊(patches)
  • 通過自注意力機制處理這些圖像塊
  • 輸出圖像的向量表示
  1. 大語言模型(LLM):
  • 接收ViT處理後的圖像特徵
  • 將圖像特徵與文本輸入結合
  • 能夠理解圖像內容並用自然語言回應

主要特點:

  • 端到端訓練
  • 可以看圖回答問題
  • 可以描述圖像內容
  • 支援多輪對話
  • 具備視覺推理能力

給它看一張貓的圖片,它不僅能認出這是貓,還能描述貓的顏色、動作、周圍環境等。



Wednesday, December 18, 2024

AI 在日常生活中的應用與服務設計

 目前AI 雲端運用如 ChatGPT, Claude, Gemini 等皆無法保證你輸入的資料不被用作訓練或外流,請謹慎使用。  

為避免隱私外流,請注意勿上傳個人隱私資料如身分,金融,病史...至雲端AI 。











R₁₂=0.85 R₂₃=0.93 R₃₄=0.89 Hazard Chain






旅遊

規劃旅遊行程 Plan an itinerary 



Saturday, December 07, 2024

River crossing interactive visualization 2

 渡河問題 1

Problem via 許元銘

direct derivation failed



A* (default python)


change to js


wrap as html


text display


visualize scenario step-by-step (default demo)



visualize scenario step-by-step (real case)





completion




additional condition

Sunday, December 01, 2024

#10 AI for workplace II

  課堂練習 

Deadline: This is an in-class exercise. 無需繳交作業。



0. 使用賽局理論制定你的公司(學校,個人)的關鍵策略






1. 為你的公司(學校),依據產業屬性,開發高階主管戰情室(或Dashboard)


2. 設計一個包裹品質檢測軟體,包裹照片請從網路搜尋,包裹可能有受潮,毀損,壓傷,正常等各種狀況


練習: 機械狗上樓梯動畫



提供參考,請自行創作



練習: 機器人上樓動畫




練習: 機器人漫步大自然草原動畫


練習: 機器人教英文