GPU. Energy Consumption and Acceleration of GPU of Molecular Dynamics Simulation. TAKURO UDAGAWA 1 and MASAKAZU SEKIJIMA 2, 3

Σχετικά έγγραφα
GPGPU. Grover. On Large Scale Simulation of Grover s Algorithm by Using GPGPU

GPU. CUDA GPU GeForce GTX 580 GPU 2.67GHz Intel Core 2 Duo CPU E7300 CUDA. Parallelizing the Number Partitioning Problem for GPUs

FPGA. Fast and Efficient Tsunami Propagation Simulation with FPGA and GPGPU

CUDA FFT. High Performance 3-D FFT in CUDA Environment. Akira Nukada, 1, 2 Yasuhiko Ogata, 1, 2 Toshio Endo 1, 2 and Satoshi Matsuoka 1, 2, 3

Binary32 (a hi ) 8 bits 23 bits Binary32 (a lo ) 8 bits 23 bits Double-Float (a=a hi +a lo, a lo 0.5ulp(a hi ) ) 8 bits 46 bits Binary64 11 bits sign

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

FX10 SIMD SIMD. [3] Dekker [4] IEEE754. a.lo. (SpMV Sparse matrix and vector product) IEEE754 IEEE754 [5] Double-Double Knuth FMA FMA FX10 FMA SIMD

Buried Markov Model Pairwise

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία

SocialDict. A reading support tool with prediction capability and its extension to readability measurement

Vol. 31,No JOURNAL OF CHINA UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb

An experimental and theoretical study of the gas phase kinetics of atomic chlorine reactions with CH 3 NH 2, (CH 3 ) 2 NH, and (CH 3 ) 3 N

ΙΕΥΘΥΝΤΗΣ: Καθηγητής Γ. ΧΡΥΣΟΛΟΥΡΗΣ Ι ΑΚΤΟΡΙΚΗ ΙΑΤΡΙΒΗ

GPU DD Double-Double 3 4 BLAS Basic Linear Algebra Subprograms [3] 2

Δθμιουργία, μελζτθ και βελτιςτοποίθςθ φωτορεαλιςτικϊν απεικονίςεων πραγματικοφ χρόνου με χριςθ προγραμματιηόμενων επεξεργαςτϊν γραφικϊν

Orthogonalization Library with a Numerical Computation Policy Interface

Αριθµητικές Μέθοδοι Collocation. Απεικόνιση σε Σύγχρονες Υπολογιστικές Αρχιτεκτονικές

ΑΠΟΔΟΤΙΚΗ ΑΠΟΤΙΜΗΣΗ ΕΡΩΤΗΣΕΩΝ OLAP Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΞΕΙΔΙΚΕΥΣΗΣ. Υποβάλλεται στην

ΥΠΟΛΟΓΙΣΤΙΚΗ ΧΗΜΕΙΑ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ ΜΟΡΙΑ, ΥΛΙΚΑ, ΠΕΡΙΒΑΛΛΟΝ. Ι ΑΣΚΟΝΤΕΣ: Μαρία Κανακίδου, Σταύρος Φαράντος, Γιώργος Φρουδάκης

ΥΠΟΛΟΓΙΣΤΙΚΗ ΧΗΜΕΙΑ ΜΕ ΕΦΑΡΜΟΓΕΣ ΣΕ ΜΟΡΙΑ, ΥΛΙΚΑ, ΠΕΡΙΒΑΛΛΟΝ

ΑΝΙΧΝΕΥΣΗ ΓΕΓΟΝΟΤΩΝ ΒΗΜΑΤΙΣΜΟΥ ΜΕ ΧΡΗΣΗ ΕΠΙΤΑΧΥΝΣΙΟΜΕΤΡΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

GPU GPU GPU GPU. GPU (Graphics Processing Unit) GPU GPU GPU AGPU [11] AGPU. GPGPU (general-purpose GPU) GPU GPU AGPU GPU

Wiki. Wiki. Analysis of user activity of closed Wiki used by small groups

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7]

Περιβάλλον Παράλληλου Προγραμματισμού

Bundle Adjustment for 3-D Reconstruction: Implementation and Evaluation

ΠΣΤΥΙΑΚΗ ΔΡΓΑΙΑ. Μειέηε Υξόλνπ Απνζηείξσζεο Κνλζέξβαο κε Τπνινγηζηηθή Ρεπζηνδπλακηθή. Αζαλαζηάδνπ Βαξβάξα

[4] 1.2 [5] Bayesian Approach min-max min-max [6] UCB(Upper Confidence Bound ) UCT [7] [1] ( ) Amazons[8] Lines of Action(LOA)[4] Winands [4] 1

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks

Retrieval of Seismic Data Recorded on Open-reel-type Magnetic Tapes (MT) by Using Existing Devices

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

An Automatic Modulation Classifier using a Frequency Discriminator for Intelligent Software Defined Radio

Research on vehicle routing problem with stochastic demand and PSO2DP algorithm with Inver2over operator

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε

H/Y Ε-07: Κατανεµηµένα Συστήµατα Εαρινό Εξάµηνο Ακ. Έτους ιδάσκουσα: Παναγιώτα Φατούρου Προγραµµατιστικές Εργασίες

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΛΕΩΝΙΔΑΣ Α. ΣΠΥΡΟΥ Διδακτορικό σε Υπολογιστική Εμβιομηχανική, Τμήμα Μηχανολόγων Μηχανικών, Πανεπιστήμιο Θεσσαλίας.

2.1

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

Approximation of distance between locations on earth given by latitude and longitude

Ερευνητική+Ομάδα+Τεχνολογιών+ Διαδικτύου+

Design Method of Ball Mill by Discrete Element Method

Probabilistic Approach to Robust Optimization

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Ειδική διάλεξη 2: Εισαγωγή στον κώδικα της εργασίας

, Evaluation of a library against injection attacks

DESIGN OF MACHINERY SOLUTION MANUAL h in h 4 0.

Assalamu `alaikum wr. wb.

Efficient Implementation of Sparse Linear Algebra Operations on InfiniBand Cluster. Akira Nishida,

Τοποθέτηση τοπωνυµίων και άλλων στοιχείων ονοµατολογίας στους χάρτες

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ ΤΙΤΛΟΣ

Capacitors - Capacitance, Charge and Potential Difference

Newman Modularity Newman [4], [5] Newman Q Q Q greedy algorithm[6] Newman Newman Q 1 Tabu Search[7] Newman Newman Newman Q Newman 1 2 Newman 3

2 nd AEGIS Technical Meeting and On-Site Visit in Mytilene, Greece

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΥΣΤΗΜΑΤΩΝ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΥΨΗΛΩΝ ΤΑΣΕΩΝ

Έργο: Υποστήριξη Υπουργείου Παιδείας, ια Βίου Μάθησης και Θρησκευµάτων σε Πληροφοριακά Συστήµατα 2011

: Monte Carlo EM 313, Louis (1982) EM, EM Newton-Raphson, /. EM, 2 Monte Carlo EM Newton-Raphson, Monte Carlo EM, Monte Carlo EM, /. 3, Monte Carlo EM

Schedulability Analysis Algorithm for Timing Constraint Workflow Models

ER-Tree (Extended R*-Tree)

Optimization, PSO) DE [1, 2, 3, 4] PSO [5, 6, 7, 8, 9, 10, 11] (P)

Research of Han Character Internal Codes Recognition Algorithm in the Multi2lingual Environment

Μηχανισμοί πρόβλεψης προσήμων σε προσημασμένα μοντέλα κοινωνικών δικτύων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

means ) ( )- 4 ) ;2 2 , < =- >?6 2 AB )4 AB ) $17,495,00 IJ 0'7 (3- &' ( - KK9 ( ()G ( <). ('2) 100% )7 )!

Quick algorithm f or computing core attribute

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ ΔΙΔΑΚΤΟΡΙΚΗΣ ΔΙΑΤΡΙΒΗΣ ΤΙΤΛΟΣ Συμπληρώστε τον πρωτότυπο τίτλο της Διδακτορικής διατριβής ΑΡ. ΣΕΛΙΔΩΝ ΕΙΚΟΝΟΓΡΑΦΗΜΕΝΗ

[1] P Q. Fig. 3.1

Εκτεταμένη περίληψη Περίληψη

Context-aware και mhealth

Finite Field Problems: Solutions

Simplex Crossover for Real-coded Genetic Algolithms

Conjoint. The Problems of Price Attribute by Conjoint Analysis. Akihiko SHIMAZAKI * Nobuyuki OTAKE

A High-speed Scheduling Method of Virtual Machine Placement with Search Parameter Estimation by Collaborative Filtering

MOTROL. COMMISSION OF MOTORIZATION AND ENERGETICS IN AGRICULTURE 2014, Vol. 16, No. 5,

Resurvey of Possible Seismic Fissures in the Old-Edo River in Tokyo

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ. «Θεσμικό Πλαίσιο Φωτοβολταïκών Συστημάτων- Βέλτιστη Απόδοση Μέσω Τρόπων Στήριξης»

Η Διαγενειακή Αλληλεπίδραση Τρίτης Γενιάς και Τρίτης Ηλικίας και οι Αντοχές της Ελληνοαυστραλιανής Ταυτότητας

DESKTOP - Intel processor reference chart

ΕΦΗΜΕΡΙΣ ΤΗΣ ΚΥΒΕΡΝΗΣΕΩΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

Appendix to On the stability of a compressible axisymmetric rotating flow in a pipe. By Z. Rusak & J. H. Lee

Κεφάλαιο 1 Αφαιρετικότητα και Τεχνολογία Υπολογιστών (Computer Abstractions and Technology)

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΕΠΑΝΑΣΧΕΔΙΑΣΜΟΣ ΓΡΑΜΜΗΣ ΣΥΝΑΡΜΟΛΟΓΗΣΗΣ ΜΕ ΧΡΗΣΗ ΕΡΓΑΛΕΙΩΝ ΛΙΤΗΣ ΠΑΡΑΓΩΓΗΣ REDESIGNING AN ASSEMBLY LINE WITH LEAN PRODUCTION TOOLS

1 (forward modeling) 2 (data-driven modeling) e- Quest EnergyPlus DeST 1.1. {X t } ARMA. S.Sp. Pappas [4]

Test Data Management in Practice

Study of In-vehicle Sound Field Creation by Simultaneous Equation Method

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

Reaction of a Platinum Electrode for the Measurement of Redox Potential of Paddy Soil

Yoshifumi Moriyama 1,a) Ichiro Iimura 2,b) Tomotsugu Ohno 1,c) Shigeru Nakayama 3,d)

Kenta OKU and Fumio HATTORI

Αλγοριθμική ασυμπτωτική ανάλυση πεπερασμένης αργής πολλαπλότητας: O ελκυστής Rössler

ΕΘΝΙΚΗ ΣΧΟΛΗ ΔΗΜΟΣΙΑΣ ΔΙΟΙΚΗΣΗΣ ΙΓ' ΕΚΠΑΙΔΕΥΤΙΚΗ ΣΕΙΡΑ

Supporting Information

HIV HIV HIV HIV AIDS 3 :.1 /-,**1 +332

ΕΛΕΓΧΟΣ ΤΩΝ ΠΑΡΑΜΟΡΦΩΣΕΩΝ ΧΑΛΥΒ ΙΝΩΝ ΦΟΡΕΩΝ ΜΕΓΑΛΟΥ ΑΝΟΙΓΜΑΤΟΣ ΤΥΠΟΥ MBSN ΜΕ ΤΗ ΧΡΗΣΗ ΚΑΛΩ ΙΩΝ: ΠΡΟΤΑΣΗ ΕΦΑΡΜΟΓΗΣ ΣΕ ΑΝΟΙΚΤΟ ΣΤΕΓΑΣΤΡΟ

GridFTP-APT: Automatic Parallelism Tuning Mechanism for Data Transfer Protocol GridFTP

Εισαγωγή. Λογισµικό & Προγραµµατισµός Συστηµάτων Υψηλής Επίδοσης

ΕΦΑΡΜΟΓΗ ΕΥΤΕΡΟΒΑΘΜΙΑ ΕΠΕΞΕΡΓΑΣΜΕΝΩΝ ΥΓΡΩΝ ΑΠΟΒΛΗΤΩΝ ΣΕ ΦΥΣΙΚΑ ΣΥΣΤΗΜΑΤΑ ΚΛΙΝΗΣ ΚΑΛΑΜΙΩΝ

Indexing Methods for Encrypted Vector Databases

(Υπογραϕή) (Υπογραϕή) (Υπογραϕή)

ΓΙΑΝΝΟΥΛΑ Σ. ΦΛΩΡΟΥ Ι ΑΚΤΟΡΑΣ ΤΟΥ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΜΑΚΕ ΟΝΙΑΣ ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ

Απόκριση σε Μοναδιαία Ωστική Δύναμη (Unit Impulse) Απόκριση σε Δυνάμεις Αυθαίρετα Μεταβαλλόμενες με το Χρόνο. Απόστολος Σ.

High order interpolation function for surface contact problem

Transcript:

GPU 1 2, 3 GPU Newton GPU CPU Energy Consumption and Acceleration of GPU of Molecular Dynamics Simulation TAKURO UDAGAWA 1 and MASAKAZU SEKIJIMA 2, 3 Molecular dynamics simulations are widely used for simulating the motion of molecules in order to gain a deeper understanding of chemical reactions, fluid flow, phase transitions, and other physical phenomena due to molecular interactions. However, these simulations require huge computer resources. In addition, the problem of energy consumption must be solved. Recently, GPGPU has attracted attention as a possible solution to these problems. In this paper, we performed molecular dynamics simulations on a CPU and GPU, and compare calculation time, power consumption and energy consumption results between them. 1 Department of Computer Science, Tokyo Institute of Technology 2 Global Scientific Information and Computing Center, Tokyo Institute of Technology 3 Department of Computer Science, Tokyo Institute of Technology 1. (Molecular Dynamics; MD) Newton 1)2) MD femto nano micro MD MD 4)3) GPU(Graphics processing units) GPU GPU GPGPU(general purpose computation on graphics processing units) GPU 6) 7) 8) GPU Nebulae NVIDIA GPU Tesla C2050 2010 6 TOP500 2 10) 2010 11 TSUBAME2.0 NVIDIA Tesla M2050 GPU IT 5) GPU 1 c 2010 Information Processing Society of Japan

CPU CPU 2. femto ( 1 ) ( 2 ) ( 3 ) ( 4 ) 1-3 ( 5 ) ( 6 ) ( 7 ) 1-6 (1) [ ( ) 12 ( ) ] 6 σ σ ϕ(r ij) = 4ε r ij r ij ij r ij i j ε σ Verlet Verlet (2)(3) r i(t +) = 2r i(t) r i(t ) + a i(t)( t) 2 (2) v i(t) = 1 [ri(t+) ri(t )] (3) 2 t (4) (5) (6) Φ = ϕ(r ij ) (4) i<j (1) K = 1 2 miv2 i (5) T = 2K (6) 3k B N m i i v i i k B N 3. GPU 3.1 NVIDIA CUDA GPU Brook+ 9),ATI Stream 11) C NVIDIA CUDA CUDA NVIDIA GPU G80 GT200 Fermi NVIDIA GPU SM(Streaming Multiprocessor) SM CUDA SM GPU SM GPU Fermi GTX480 15 SM SM 32 CUDA 480 CUDA CUDA CPU C GPU GPU GPU CPU GPU CPU GPU GPU CUDA ( 1) CUDA SM SM 32 14) 2 c 2010 Information Processing Society of Japan

potential energy kinetic energy kernel function2 1 CUDA memory (atoms data) 3.2 GPU GPU CPU GPU GPU GPU Mahsan Rofouei separate convolutions LEAP-Server GPU GPU 12) GPU 1 Nebulae TOP500 2 Nebulae 2010 6 Green500 4 13) Green500 MFLOPS/watt TOP500 1 Jugar Green500 56 4. CUDA CUDA ( 1 ) GPU ( 2 ) CPU GPU ( 3 ) ( 4 ) ( 5 ) GPU CPU ( 6 ) 2 5 3 GPU kernel function1 th.1 th.2 th.3 th.n 2 GPU ( 2) CPU 100 5. CPU Intel Core i7-860 2.80GHz CPU 4 256KB L2 8MB L3 GB DDR3 SDRAM GPU NVIDIA GT240 GT240 96 CUDA OS Ubuntu9.04 CUDA 3.0 3 c 2010 Information Processing Society of Japan

MD CPU GPU SYSTEM ARTWARE WATT-HOUR METER SHW3A 8 64 128 512 1024 4096 8192 32768 65536 NEV 6. 1, 3 4 CPU 8 CPU 0.003 GPU 0.0089 CPU-GPU GPU 64 GPU CPU MD GPU 1 results atoms value CPU GPU 8 64 512 65536 sec 0.0030 0.0089 watt 92.5 114 joule 0.2775 1.015 sec 0.160 0.038121 watt 94.3 115 joule 15.088 4.384 sec 8.280 0.2941 watt 94.8 121 joule 784.944 35.59 sec 106508 1554.98 watt 98.5 136 joule 10491038 211477 GPU CPU elapsed calculation time energy consumption(j) 5000 4000 3000 2000 1000 500000 400000 300000 200000 100000 0 0 10000 20000 30000 40000 50000 60000 70000 3 number of atoms CPU GPU CPU GPU 0 0 10000 20000 30000 40000 50000 60000 70000 number of atoms 4 4 c 2010 Information Processing Society of Japan

GPU GPU GPU 7. CPU GPU MD GPU GPU GPU GPU 7) Peter Bakkum et al, Accelerating SQL database operations on a GPU with CUDA ACM International Conference Proceeding Series; Vol. 425, Proceedings of the 3rd Workshop on General-Purpose Computation on Graphics Processing Units, pp.94-103 8) J. Michalakes and M.Vachharajani, GPU Acceleration of Numerical Weather Prediction, Parallel Processing Letters, 18, pp. pp.531 548, 2008. 9) AMD Brook+ Presentation. In SC07 BOF Session, 2007. 10) http://www.top500.org/ 11) Advanced Micro Devices, Inc., GPU and CPU Technology for Accelerated Computing, http://www.amd.com/us/products/technologies/ STREAM-TECHNOLOGY/Pages/stream-technology.aspx 12) Mahsan Rofouei, Thanos Stathopoulos, Sebi Ryffel, William Kaise, and Majid Sarrafzadeh, Energy-Aware High Performance Computing with Graphic Processing Units, In Proceedings of the Workshop on Power Aware Computing and Systems 2008 (HotPower 08), 2008. 13) http://www.green500.org/ 14) NVIDIA CUDA C Programming Guide Version 3.1.1 http://developer.nvidia.com/object/cuda.html 1) M. Sekijima, C. Motono, S. Yamasaki, K. Kaneko, and Y. Akiyama, Molecular dynamics simulation of dimeric and monomeric forms of human prion protein: Insight into dynamics and properties Biophysical Journal,85, pp.1176-1185, 2003. 2) K. Sugawara, S. Saito, M. Sekijima, K. Ohno,Y. Tajima, M.A. Kroos, A.J. Reuser, H. Sakuraba, Structural modeling of mutant alpha-glucosidases resulting in a processing/transport defect in Pompe disease, J Hum Genet, 54, pp. 324-330, 2009. 3) M. Sekijima, J. Doi, T. Noguchi, and S. Shimizu, Optimization and Evaluation of Parallel Molecular Dynamics Simulation on Blue Gene/L, In Proceedingsof the IASTED International Conference on Parallel and Distributed Computer and Networks (PDCN2007), pp.257-262, 2007. 4) M. Sekijima, S. Takasaki, S. Nakamura and K Shimizu, Automatic Improvement of Scheduling Policies in Parsley Parallel Programming Environment In Proceedings of the 14th IASTED International Conference on Parallel and Distributed Computing and Systems (PDCS 2002), pp.380-385, Cambridge, Massachusetts, USA, November 2002. 5) Michael Feldman, The Greening of HPC, http://www.hpcwire.com/features/the Greening of HPC.html 6) W.Y. Liang, T.J. Hsieh, M.T. Satria, Y.L. Chang, J.P. Fang, C.C. Chen, and C.C. Han, A GPU-Based Simulation of Tsunami Propagation and Inundation Algorithms and Architectures for Parallel Processing, pp.593-603, 5574, 2009. 5 c 2010 Information Processing Society of Japan