0%

今年為期兩天的黑客松終於結束了,獎項也公布了,雖然沒有獲得獎項,但我對我們的成品是滿意的。

這是我第一次參加這種大型的黑客松活動,而我們隊選了LightCurve這個主題,對這個主題我是完全沒有相關知識及經驗,但是隊友們非常的厲害,開賽前把論文讀完並用matlab做了簡單的演示,目標是利用3D模型算出LightCurve並在前端顯示出來。

首先是分工,計算LightCurve這部分就得將matlab的code轉成javascript的,還要利用three.js來做成小行星的動畫,這邊是由我的隊友們完成的,真的是非常厲害,而我和另一位隊友負責把網站整個流程做好,從選取、設定參數到結果頁面,我們選的是Vue+Bootstrap,第一天結束時,網站的各個頁面是大致完成,但是code也開始變得雜亂,也造就了第二天debug難度增加,然後為了開發快速,我們沒有使用資料庫,所有資料都存在localstorage裡(有一部分是因為Component的參數傳遞不太會),包括使用者上傳的OBJ檔都存在裡面,到後面受不了還是包成一個變數。

在第二天時有個小成果發表的視訊會議,會有評審給相關意見,我們在發表前的內容是非常完整的,但是影片只有30秒,導致開完場能介紹操作的時間都不長了,播完影片、Demo完,評審唯一的意見是影片中的東西太少,非常多功能沒有介紹到,隊友還因為有我們有做但前端還沒顯示出來的東西跟評審有小爭執,最後我們利用比賽剩餘時間將這功能show出來。

參賽完也深刻的理解到很多操作不太熟,很多問題是有非常多好的工具可以解的,然後在黑客松這個場合多多問隊友會更快,而且隊友有用非常多輔助討論的工具,對於想法的整理幫助很大,尤其miro在彙整想法時真的非常好用,甚至可以畫出簡單的wireframe讓我能知道要怎樣刻,最後感謝我的隊友們,希望之後能參加到實體的黑客松!

最後附上 成品

前言

這篇文章主要是記錄我的學習歷程,以棒球為主題搭建一個數據查詢的網站,從取得資料到架設網站,過程會使用Python來爬取及架設網站。

閱讀全文 »

正規化

消除資料間的依賴性,而使得資料庫檔案內的資料欄位分配合理化,確定哪些資料欄位該在同一檔案內,哪些欄位又該分開在不同檔案內,使資料不重複。

解決在資料更新、增刪時所衍生之問題。

比較常見的有

資料庫(實作)

SQL 基本類型

  • char(n):用來存放固定長度為n的字串資料
  • varchar(n):用來存放最大長度為n的字串資料,實際儲存長度會依資料量而調整
  • int:用來存放整數資料,最大可存放長度為4位元
  • smallint:用來存放整數資料,最大可存放長度為2位元
  • numeric(p,d):用來存放帶有小數的數值,使用時須指明精確度與小數點位數。此表示資料精準度為p 位數,而p 位數中含有d 位數的小數
  • real, double precision:用來存放近似浮點數值,其精準度會因機器而產生誤差
  • float(n):用來存放浮點數值,精準度至少為n位數
閱讀全文 »

Database System

設計資料庫的階段(Phases for designing a database)

  • Requirements specification and analysis
  • Conceptual design
  • Logical design
  • Physical design
閱讀全文 »

方法設計

  1. 使用jieba斷詞,設置自定義字典
  2. 每篇文章斷詞後,計算每篇文章對於這個集合中的詞的詞頻生成兩篇文章各自的詞頻向量
  3. 計算兩個向量的餘弦相似度,值越大就表示越相似

實現說明

爬取文章

我們利用爬蟲爬取分析目標的粉絲專頁,並將其內容寫入MySQL裡的facebook資料表,並將jieba斷詞後不重複的結果寫入MySQL的dictionary資料表中word欄位

閱讀全文 »