劍橋大學碩博申請(88)——數據密集科學碩士(劍橋大學數據庫)
劍橋大學碩士博士申請
數據密集科學碩士
數據密集科學碩士課程是物理科學學院的一項為期 10 個月的跨學科課程,旨在提供最高質量的碩士教育。該課程涵蓋了現代數據驅動科學所需的全部技能,涉及機器學習和人工智能、統(tǒng)計數據分析以及研究計算等領域。
課程結構是與我們領先的研究人員和行業(yè)合作伙伴合作設計的,旨在為學生提供從事世界領先的數據密集型科學研究所需的理論知識、實踐經驗和可遷移技能。學生將獲得科學數據分析所需的廣泛技能,包括傳統(tǒng)統(tǒng)計技術和現代機器學習方法。 將講授這些技術的理論基礎和實際應用,后者包括軟件開發(fā)最佳實踐和開放科學原則方面的培訓。課程還旨在為學生提供將這些方法應用于特定科學領域當前研究問題的直接經驗。完成課程的學生將具備從事數據密集型科學項目研究的能力。除學術學科外,學生還將為在廣泛的商業(yè)領域從事數據科學專業(yè)工作做好充分準備。
本課程將幫助學生掌握現代科學數據分析所需的所有技能,使他們能夠使用部署在尖端計算機架構上的最新統(tǒng)計和機器學習工具,參與大型實驗或觀測項目。這些計算和統(tǒng)計技能還將直接應用于工業(yè)領域的數據驅動型問題解決。
該課程響應了日益增長的
對訓練有素的研究科學家的需求不斷增長,他們需要為下一代科學實驗產生的日益龐大和復雜的數據集設計和實施數據分析管道;
社會對數據科學和數據分析技能的需求,尤其是在戰(zhàn)略領域(科學、健康)和經濟領域(金融、電子商務)的應用;
需要培養(yǎng)研究生,使其深入了解數據科學技術、現代計算機架構的算法構建以及軟件開發(fā)的行業(yè)最佳實踐;
開放科學在研究中的重要性,特別是科學成果的可復制性和公共數據分析代碼的創(chuàng)建。
學習成果
通過本課程的學習,學生將掌握
全面了解統(tǒng)計分析,包括其在研究中的應用,以及它如何支撐現代機器學習方法;
全面了解數據科學和機器學習技術和軟件包及其在多個實際研究領域中的應用;
利用按照開放科學標準創(chuàng)建的現代軟件開發(fā)最佳實踐,發(fā)展高級計算機編程技能;
展示批判性評估數據科學工具和方法在現實世界中應用于科學研究問題的能力。
繼續(xù)深造
希望在通過碩士學位考試后繼續(xù)攻讀博士學位的學生,應通過大學招生網站申請攻讀博士學位,并將資金和申請截止日期考慮在內。
教學
教學內容包括兩種模塊類型:主要模塊涵蓋科學數據分析所需的所有基本方面,次要模塊則展示這些數據科學技能在實際科學研究領域的應用??忌偣残枰x修 7 個模塊進行評估,其中包括 5 個主要模塊和 2 個次要模塊。這些模塊將從以下模塊中選擇
– 選擇(至少 6 個)主要模塊
– 選擇(至少 4 個)次要模塊
主要模塊將在彌迦勒學期和四旬齋學期講授。它們將涵蓋所有學生應掌握的主要材料,涵蓋三個主題領域:統(tǒng)計數據分析、機器學習和人工智能,以及研究計算和軟件開發(fā)。這些主要模塊將使學生掌握頂級科學數據分析的基本技能。
副修模塊將在四旬齋和復活節(jié)學期授課。提供的次要模塊將每年更新,以應對研究領域的變化。這些模塊將涵蓋主要模塊中教授的核心技術在具體科研問題中的應用。除了說明可能具有更廣泛應用的有用數據科學方法之外,輔修模塊還旨在讓學生深入了解相關領域的目標和現狀,從而幫助有興趣的學生為在這些領域開展研究做好準備。
數據分析項目將側重于研究文獻中關鍵科學數據分析的可重復性。學生將在彌迦勒學期從預先批準的清單中選擇自己的項目,并在四旬齋和復活節(jié)期間完成項目,在課程結束時提交。項目的設計將是開放式的,因此學生可以改進或擴展文獻中已發(fā)表的內容。 每個項目的主題將由幾名學生共同選擇,但他們將獨立完成,并由負責的學術顧問進行個別指導,教學團隊也將提供進一步的建議和支持。
該課程還包括旨在拓寬學生知識面的非考核內容。 其形式包括專業(yè)主題的短期模塊、交流研討會、每周系列研討會以及由我們的行業(yè)合作伙伴主導的行業(yè)應用模塊。
一對一指導
學生在課程主任的總體指導下學習。每位學生都有一名學術導師,負責指導學生選擇課程,并對學生提出的指導要求做出回應。
劍橋大學每年都會發(fā)布《實踐守則》,其中規(guī)定了劍橋大學對督導工作的要求。
研討會和課程
該課程設有研討會計劃,每周邀請學術界和工業(yè)界人士發(fā)表演講。
講座
學生每年將有大約 120 個小時的主修模塊講座(關于數據科學的基本技能)和 32 個小時的副修模塊講座(關于數據科學技術在科學領域的應用)。
小組教學
所有模塊都將提供小組示范課,主要模塊約為 40 個課時,次要模塊約為 16 個課時。
文獻綜述
文獻綜述是數據分析項目報告的一部分。
演講
作為項目評估的一部分,學生必須就其數據分析項目進行演講,并在小組示范課上進行口頭演講。
反饋
模塊負責人會對學生的書面考試成績、口頭報告和課程作業(yè)成績進行反饋;數據分析項目主管會對數據分析項目的進展情況進行反饋。
該委員會通常每年召開五次會議,由來自每個研究小組或碩士學位課程的一名或多名學生代表組成。該委員會旨在討論任何影響研究生學習的問題,學生可以向委員會的任何成員提出討論項目。
評估論文
數據分析項目主要涉及關鍵科學分析的可重復性。項目將從三個方面進行評分:項目報告、為分析開發(fā)的配套數據分析管道和項目口頭報告。
報告篇幅不得超過 7000 字,必須描述分析管道及其開發(fā)、項目目標和取得的成果。 報告必須附有不超過 1000 字的工作執(zhí)行摘要。
用于分析的數據分析程序也必須以可訪問和可復制的形式提供給評審人員。
口頭陳述將用于確認考生對項目的理解,并澄清報告或分析管道中不明確的任何要點。 評審員可在陳述過程中向候選人提問,以進一步探討項目的任何方面、提交的材料、陳述或與項目相關的其他背景知識。
其他
每個主修和輔修模塊將通過以下方式進行綜合評估:
課程作業(yè)通常采用報告的形式,結合數據分析管道本身,描述特定數據分析方法的開發(fā)和實施情況,長度一般不超過 3000 字,但具體形式將取決于模塊。 報告應簡明扼要,并將根據論據的質量、表述的清晰度和解釋的深刻性進行評判。 評判管道本身的標準是:是否符合 "研究計算機 "主修模塊中講授的軟件開發(fā)最佳實踐,以及管道在準確性、應用范圍、易用性、穩(wěn)健性和穩(wěn)定性方面的質量。
筆試為閉卷考試,主要通過計算、簡答題和論文測試考生的理論知識。
作為示范課的一部分或對提交的課程作業(yè)進行評估的一部分,要求對考生的作品進行口頭演示。這對于促進學生之間的相互學習、建立團隊以及為學生提供交流工作的經驗尤為重要。學生將被要求簽署一份行為準則,以確保這些小組討論對所有參與者都具有協作性和支持性。
在數據密集科學碩士課程中,評估課程內容的權重如下:
項目報告(數據分析項目)將占期末成績的 25% (25%);
教學單元考試(包括書面作業(yè)、書面考試和口頭報告)將占期末成績的 75%(其中……):
每個主要模塊占期末成績的 12%。
每個次要單元占期末成績的 7.5%。
入學要求
預期學術標準
申請本課程者應獲得英國良好 II.i 榮譽學位。
申請人的學位應為理科或技術學科,申請人應具備一定的數學能力,尤其是線性代數、統(tǒng)計學和概率論方面的能力。
語言要求
雅思(學術)考試總分7.0
聽力7.0
寫作 7.0
閱讀 6.5
口語 7.0
托??荚嚲W絡成績總分 100
聽力 25
寫作 25
閱讀25分
口語25分
來自中國學生申請要求
如果申請的專業(yè)只要求大學綜合均分
985/211的學士學位,總成績85%或GPA3.5/4.0 或者,雙非一本的學士學位,總成績88%或GPA3.7/4.0 或者,其他院校的學士學位,總成績90%或GPA3.9/4.0
如果申請的專業(yè)要求專業(yè)均分:
985/211的學士學位,總成績?yōu)?0%或GPA 3.8/4.0 或者,雙非一本的學士學位,總成績?yōu)?2%或GPA 3.9/4.0 或者,其他公認機構的學士學位,總成績?yōu)?5%或GPA 4.0/4.0
學雜費:48555英鎊/年
此文章摘自學校官方網站:MPhil in Data Intensive Science | Postgraduate Study (cam.ac.uk)