FX10 SIMD SIMD. [3] Dekker [4] IEEE754. a.lo. (SpMV Sparse matrix and vector product) IEEE754 IEEE754 [5] Double-Double Knuth FMA FMA FX10 FMA SIMD

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "FX10 SIMD SIMD. [3] Dekker [4] IEEE754. a.lo. (SpMV Sparse matrix and vector product) IEEE754 IEEE754 [5] Double-Double Knuth FMA FMA FX10 FMA SIMD"

Transcript

1 FX,a),b),c) Bailey Double-Double [] FMA FMA [6] FX FMA SIMD Single Instruction Multiple Data [] Bailey SIMD SIMD 8bit FMA (SpMV Sparse matrix and vector product) FX. DD Bailey Double-Double a) em49@ns.kogakuin.ac.jp b) fujii@cc.kogakuin.ac.jp c) teru@cc.kogakuin.ac.jp [] Double-Double Knuth [] Dekker [4] SIMD IEEE754 a a.hi a.lo 5 =4bit bit IEEE754 bit 5bit IEEE754 8bit 4bit IEEE754 [5] FMA FMA 4 c 5 Information Processing Society of Japan

2 DD_ADD(a, b, c) { //a = b + c sh = b.hi + c.hi; th = sh - b.hi; tl = sh - th; th = c.hi - th; tl = b.hi - tl; eh = tl + th; eh = eh + b.lo; eh = eh + c.lo; a.hi = sh + eh; a.lo = a.hi - sh; a.lo = eh - a.lo; DD_MUL(a, b, c) { //a = b * c sp = 4779.; p = b.hi * c.hi; tq = sp * b.hi; bh = tq - (tq - b.hi); DD_MUL(a, b, c) { //a = b * c p = b.hi * c.hi; p = b.hi * c.hi - p; p = b.hi * c.lo + p; p = b.lo * c.hi + p; bl = b.hi - bh; a.hi = p + p; tq = sp * c.hi; a.lo = p - (a.hi - p); ch = tq - (tq - c.hi); cl = c.hi - ch; p = bh * ch - p; p = bh * cl + p; p = bl * ch + p; p = bl * cl + p; p = b.hi * c.lo + p; p = b.lo * c.hi + p; a.hi = p + p; a.lo = p - (a.hi - p); (nofma) 4 FMA. FX DD. FX FX FMA 56 HPC-ACE 5 FX FLA FLB FMA step 4 FMA 8bit 56 HPC-ACE[9] SIMD 5 FX :SPARC64 T M IXfx Extensions[7] FMA 5 9 FX 5step FMA FMA 7step FMA FMA step 5 7. =5/7 FMA step SIMD FMA FLA FLB x86 6 step move c 5 Information Processing Society of Japan

3 6 FX 56. SIMD 6 AoS : Array of Structure (SoA : Structure of Array) SIMD SoA [] A B A.hi B.lo A.lo B.hi AoS 8bit SIMD shuffle SoA shuffle SoA Lis[] FX AoS FX fast dd[8] FX SPARC64 T M VIIIfx@. GHz (8 cores L Cache KiB L Cache 6MiB) DDR SDRAM Bandwidth 64GB/s FX SPARC64 T M IXfx@.848 GHz (6 cores L Cache KiB L Cache MiB) DDR SDRAM Bandwidth 85GB/s C O OpenMP -Kopenmp -Kprefetch conditional -Kdalign -Knoeval -O fma -no-fma K FX Processor SPARC64 T M VIIIfx IXfx Frequency. GHz.848GHz Number of Core 8 6 Number of Register L Cache per core KB KB L Cache 6MB MB Memory DDR SDRAM Memory Size 6GB GB Memory Bandwidth 64GB/s 85GB/s Compiler Vectorization Options Options (nofma) Fujitsu Compiler (fccpx) HPC-ACE -Kopenmp -Kprefetch conditional -Kdalign -Knoeval -O -Kopenmp -Kprefetch conditional -Kdalign -Knoeval -O -no-fma FX Name Operation Load Store step nofma (fma) axpy y = αx + y 6 (8) axpyz z = αx + y 6 (8) xpay y = x + αy 6 (8) scale x = αx 5 (7) dot val = x y 6 (8) nrm val = x (6) 4. OpenMP 8 x y z α val 6 SIMD FMA 4 L 4 lis Lis lisbased lis fastdd fast dd scalar simd SIMD nofma fma FMA 5 lis scalar nofma scale FMA 5step 7step..7 SIMD.64 fastdd simd fastdd scalar.8 fast dd Lis c 5 Information Processing Society of Japan

4 L ( 6MiB) Time [ms] (speed up ratio) lis scalar nofma lis scalar fma lisbased simd nofma 4 lisbased simd fma 5 fastdd scalar 6 fastdd simd scale.5 (. ).4 (. ).9 (.6 ).9 ( 5.98 ).96 (.5 ).4 (.48 ) axpy.48 (. ). (.5 ).8 (.75 ). ( 4.6 ).9 (.4 ).4 (.4 ) xpay.48 (. ). (.5 ).8 (.7 ). ( 4.64 ). (.4 ).4 (. ) axpyz.48 (. ). (.5 ).7 (.77 ). ( 4.7 ). (.4 ).4 (. ) dot.95 (. ).66 (.44 ).7 (.59 ). ( 4.9 ).7 (.44 ).86 (. ) nrm.84 (. ).65 (.8 ). (.7 ).8 ( 4.6 ).6 (.4 ).8 (.4 ) 4 L ( GB) Time [s] (speed up ratio) lis scalar nofma lis scalar fma lisbased simd nofma 4 lisbased simd fma 5 fastdd scalar 6 fastdd simd scale.8 (. ).4 (.7 ). (.64 ). (.6 ).5 (.5 ).5 (.49 ) axpy. (. ).7 (.5 ).4 (.74 ). (.79 ).4 (.4 ).9 (. ) xpay. (. ).7 (.5 ).4 (.74 ). (.7 ). (.4 ).9 (. ) axpyz. (. ).7 (.5 ).4 (.7 ). (.69 ). (.4 ).9 (. ) dot.5 (. ). (.45 ).6 (.6 ). ( 4.7 ).4 (.44 ). (. ) nrm. (. ). (.4 ).5 (.7 ).4 (.7 ). (.4 ). (.4 ) FMA SIMD 5.7 = Vector Size.. 8 scale 7 flop performance[gf olps] = V ectorsize/time 9 L 6MB (Vector Size = 6. 5 ) MB (Vector Size =. 6 ).5GFlops 5MB (Vector Size =. 7 ).GFlops scale Store axpy xpay axpyz dot nrm L FX 4. CRS FMA SIMD SpMV FMA SIMD FX 6 performance [GFlops] SoA AoS fma nofma simd scalar lisbased - simd - fma lisbased - simd - nofma lis - scalar - fma lis - scalar - nofma fastdd - simd fastdd - scalar Vector Size scale( x = αx ) CRS(Compressed Row Storage) [] A nnz row value index pointer index value index nnz pointer row c 5 Information Processing Society of Japan 4

5 DD_SpMV(A, x, y) { //y = A * x for(i=:i<a.row;++i) { js = A.ptr[i]; je = A.ptr[i+]; vy = _mm_setzero_pd(); for(j=js;j<je;j+=) { va = _mm_load_pd(&a.val[j]) vx = _mm_set_pd(x[a.index[j+]], x[a.index[j]]) DD_MUL(tmp, va, vx,); DD_ADD(vy, vy, tmp,); y[i] = redction(vy); fraction_padding() 8 SIMD SpMV x index value SIMD 8 x SET SpMV A D x DD y DD =A D x DD DD-SpMV FMA A A.hi 7step SIMD SET fraction processing() y reduction() The Univ. of Florida Sparse Matrix Collection[] ( ) row 5 45 A if( j-i )A[i][j] = value else A[i][j] = 5 performance [GFlops] CRS CRS - u CRS - u4 CRS - u nnz/row DD-SpMV ( ) performance[f lops] = nnz/time 9,,4,6 DD-SpMV row 5 4 nnz/row nnz/row 8 DD-SpMV step FLA/FLB Load,Store,Brunch 8step FLA FLB 7step.6 DD-SpMV DD-SpMV CRS u.6 6 CRS u CRS u6 8 DD-SpMV fraction processing() reduction() DD- SpMV 45 DD-SpMV CRS c 5 Information Processing Society of Japan 5

6 relative performance CRS CRS - u CRS - u4 CRS - u Matrix Number (sorting by relative performance of CRS - u6) DD-SpMV ( ) performance [GFlops] CRS CRS - u CRS - u4 CRS - u Matrix Number (sorting by performance of CRS) DD-SpMV ( ) CRS u6 CRS CRS CRS CRS u6 CRS 4.5. nnz/row nnz/row 5. FX FMA SIMD FMA.. SIMD 4 5 x FX nnz/row. AICS HPC (4 ) JSPS 544 [] Bailey,D,H., High-Precision Floating-Point Arithmetic in Scientic Computation., computing in Science and Engineering, pp.54-6 (5). [] Hasegawa, H., Utilizing the Quadruple-Precision floating-point Arithmetic Operation for the Krylov Subspace Methods, The 8th SIAM Conference on Applied Linear Algebra (). [] Knuth,D,E., The Art of Computer Programming: c 5 Information Processing Society of Japan 6

7 Seminumerical Algorithms, Vol., Addison-Wesley (969). [4] Dekker,T., A floating-point technique for extending the available precision, Numerische Mathematik, Vol.8, pp.4-4 (97). [5],,,, AVX BCRS, (ACS), Vol.7, No.4, pp.5- (4). [6] FUJITSU, Super Computer K., [7] FUJITSU, SPARC64 T M IXfx Extensions., [8] FUJITSU, 4 (). [9] FUJITSU, C++PREMEHPC FX, pp.48-6 (). [] SSI, Lis., [],.,, pp.9-4 (). [] R. Barrett et al., Templates for the Solution of Linear Systems: Building Blocks for Iterative Methods, SIAM pp (994). [] The University of Florida Sparse Matrix Collection., c 5 Information Processing Society of Japan 7

GPU DD Double-Double 3 4 BLAS Basic Linear Algebra Subprograms [3] 2

GPU DD Double-Double 3 4 BLAS Basic Linear Algebra Subprograms [3] 2 GPU 4 1,a) 2,b) 1 GPU Tesla M2050 Double-Double DD 4 BiCGStab GPU 4 BiCGStab 1 1.0 2.2 4 GPU 4 1. IEEE754-2008[1] 128bit binary128 CG Conjugate Gradient [2] 1 1 2 a) mukunoki@hpcs.cs.tsukuba.ac.jp b) daisuke@cs.tsukuba.ac.jp

Διαβάστε περισσότερα

Binary32 (a hi ) 8 bits 23 bits Binary32 (a lo ) 8 bits 23 bits Double-Float (a=a hi +a lo, a lo 0.5ulp(a hi ) ) 8 bits 46 bits Binary64 11 bits sign

Binary32 (a hi ) 8 bits 23 bits Binary32 (a lo ) 8 bits 23 bits Double-Float (a=a hi +a lo, a lo 0.5ulp(a hi ) ) 8 bits 46 bits Binary64 11 bits sign Maxwell GPU DGEMM 1,a) 1,b) NVIDIA 2014 Maxwell GM107 GM204 GPU : =1:32 GM204 GeForce GTX 980 2 double-float DF BLAS DGEMM DGEMM DF DGEMM 2 1. IEEE 754-2008[1] binary32 binary64 NVIDIA GPU 2010 Fermi :

Διαβάστε περισσότερα

GMRES(m) , GMRES, , GMRES(m), Look-Back GMRES(m). Ax = b, A C n n, x, b C n (1) Krylov.

GMRES(m) , GMRES, , GMRES(m), Look-Back GMRES(m). Ax = b, A C n n, x, b C n (1) Krylov. 211 9 12, GMRES,.,., Look-Back.,, Ax = b, A C n n, x, b C n (1),., Krylov., GMRES [5],.,., Look-Back [3]., 2 Krylov,. 3, Look-Back, 4. 5. 1 Algorith 1 The GMRES ethod 1: Choose the initial guess x and

Διαβάστε περισσότερα

GPGPU. Grover. On Large Scale Simulation of Grover s Algorithm by Using GPGPU

GPGPU. Grover. On Large Scale Simulation of Grover s Algorithm by Using GPGPU GPGPU Grover 1, 2 1 3 4 Grover Grover OpenMP GPGPU Grover qubit OpenMP GPGPU, 1.47 qubit On Large Scale Simulation of Grover s Algorithm by Using GPGPU Hiroshi Shibata, 1, 2 Tomoya Suzuki, 1 Seiya Okubo

Διαβάστε περισσότερα

CUDA FFT. High Performance 3-D FFT in CUDA Environment. Akira Nukada, 1, 2 Yasuhiko Ogata, 1, 2 Toshio Endo 1, 2 and Satoshi Matsuoka 1, 2, 3

CUDA FFT. High Performance 3-D FFT in CUDA Environment. Akira Nukada, 1, 2 Yasuhiko Ogata, 1, 2 Toshio Endo 1, 2 and Satoshi Matsuoka 1, 2, 3 Vol. 1 No. 2 231 239 (Aug. 2008) CUDA 3 FFT 1, 2 1, 2 1, 2 1, 2, 3 NVIDIA GPU CUDA CUDA 3 FFT GeForce 8 GPU 3 FFT CUFFT 1.1 3.1 3.3 79.5 GFLOPS High Performance 3-D FFT in CUDA Environment Akira Nukada,

Διαβάστε περισσότερα

GPU. CUDA GPU GeForce GTX 580 GPU 2.67GHz Intel Core 2 Duo CPU E7300 CUDA. Parallelizing the Number Partitioning Problem for GPUs

GPU. CUDA GPU GeForce GTX 580 GPU 2.67GHz Intel Core 2 Duo CPU E7300 CUDA. Parallelizing the Number Partitioning Problem for GPUs GPU 1 1 NP number partitioning problem Pedroso CUDA GPU GeForce GTX 580 GPU 2.67GHz Intel Core 2 Duo CPU E7300 CUDA C Pedroso Python 323 Python C 12.2 Parallelizing the Number Partitioning Problem for

Διαβάστε περισσότερα

Τελική Εξέταση, Απαντήσεις/Λύσεις

Τελική Εξέταση, Απαντήσεις/Λύσεις ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών (ΗΜΜΥ) HMΜY 212 Οργάνωση Η/Υ και Μικροεπεξεργαστές Εαρινό Εξάμηνο, 2007 Τελική Εξέταση, Απαντήσεις/Λύσεις Άσκηση 1: Assembly για

Διαβάστε περισσότερα

A Fast Finite Element Electromagnetic Analysis on Multi-core Processer System

A Fast Finite Element Electromagnetic Analysis on Multi-core Processer System Vol. 3 No. 3 189 198 (Sep. 2010) 1 1 1 2 2 Arnold Folk Winther A Fast Finite Element Electromagnetic Analysis on Multi-core Processer System Takeshi Mifune, 1 Yu Hirotani, 1 Takeshi Iwashita, 1 Toshio

Διαβάστε περισσότερα

BiCG CGS BiCGStab BiCG CGS 5),6) BiCGStab M Minimum esidual part CGS BiCGStab BiCGStab 2 PBiCG PCGS α β 3 BiCGStab PBiCGStab PBiCG 4 PBiCGStab 5 2. Bi

BiCG CGS BiCGStab BiCG CGS 5),6) BiCGStab M Minimum esidual part CGS BiCGStab BiCGStab 2 PBiCG PCGS α β 3 BiCGStab PBiCGStab PBiCG 4 PBiCGStab 5 2. Bi BiCGStab 1 1 2 3 1 4 2 BiCGStab PBiCGStab BiCG CGS CGS PBiCGStab BiCGStab M PBiCGStab An improvement in preconditioned algorithm of BiCGStab method Shoji Itoh, 1 aahiro Katagiri, 1 aao Saurai, 2 Mitsuyoshi

Διαβάστε περισσότερα

Quick algorithm f or computing core attribute

Quick algorithm f or computing core attribute 24 5 Vol. 24 No. 5 Cont rol an d Decision 2009 5 May 2009 : 100120920 (2009) 0520738205 1a, 2, 1b (1. a., b., 239012 ; 2., 230039) :,,.,.,. : ; ; ; : TP181 : A Quick algorithm f or computing core attribute

Διαβάστε περισσότερα

Implementation and performance evaluation of iterative solver for multiple linear systems that have a common coefficient matrix

Implementation and performance evaluation of iterative solver for multiple linear systems that have a common coefficient matrix Implementation and performance evaluation of iterative solver for multiple linear systems that have a common coefficient matrix, 1-1, E-mail almisofte@gmail.com, 7-1-26, E-mail keno@riken.jp, 1-1, E-mail

Διαβάστε περισσότερα

Προχωρηµένα Θέµατα Αρχιτεκτονικής

Προχωρηµένα Θέµατα Αρχιτεκτονικής Προχωρηµένα Θέµατα Αρχιτεκτονικής Μάθηµα 2 ο : Instruction Set Principles and Examples Μάθηµα 2 ο Προχωρηµένα Θέµατα Αρχιτεκτονικής 1 Σχεδιασµός Συνόλου Εντολών Θέµατα που θα συζητηθούν ιαφορετικές επιλογές

Διαβάστε περισσότερα

Performance improvement of iterative solver using bit-compression for a sparse matrix

Performance improvement of iterative solver using bit-compression for a sparse matrix E6- Performance improvement of iterative sover using -compression for a sparse matrix, 7--6, E-mai keno@riken.jp Kenji Ono, RIKE AICS, 7--6 Minatojima-minami-cho, Chuo-ku, Kobe, Japan A nobe Bit-representation/compression

Διαβάστε περισσότερα

Filter Diagonalization Method which Constructs an Approximation of Orthonormal Basis of the Invariant Subspace from the Filtered Vectors

Filter Diagonalization Method which Constructs an Approximation of Orthonormal Basis of the Invariant Subspace from the Filtered Vectors 1 Av=λBv [a, b] subspace subspace B- subspace B- [a, b] B- Filter Diagonalization Method which Constructs an Approximation of Orthonormal Basis of the Invariant Subspace from the Filtered Vectors Hiroshi

Διαβάστε περισσότερα

Παρουσίαση 2 ης Άσκησης:

Παρουσίαση 2 ης Άσκησης: Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Παρουσίαση 2 ης Άσκησης: Ανάπτυξη παράλληλου κώδικα και μελέτη επίδοσης του αλγόριθμου

Διαβάστε περισσότερα

Efficient Implementation of Sparse Linear Algebra Operations on InfiniBand Cluster. Akira Nishida,

Efficient Implementation of Sparse Linear Algebra Operations on InfiniBand Cluster. Akira Nishida, InfiniBand,,.,, PCI Express InfiniBand,,.,,. Efficient Implementation of Sparse Linear Algebra Operations on InfiniBand Cluster Akira Nishida, Construction of scalable and low cost parallel computing environment

Διαβάστε περισσότερα

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7]

Re-Pair n. Re-Pair. Re-Pair. Re-Pair. Re-Pair. (Re-Merge) Re-Merge. Sekine [4, 5, 8] (highly repetitive text) [2] Re-Pair. Blocked-Repair-VF [7] Re-Pair 1 1 Re-Pair Re-Pair Re-Pair Re-Pair 1. Larsson Moffat [1] Re-Pair Re-Pair (Re-Pair) ( ) (highly repetitive text) [2] Re-Pair [7] Re-Pair Re-Pair n O(n) O(n) 1 Hokkaido University, Graduate School

Διαβάστε περισσότερα

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o

3: A convolution-pooling layer in PS-CNN 1: Partially Shared Deep Neural Network 2.2 Partially Shared Convolutional Neural Network 2: A hidden layer o Sound Source Identification based on Deep Learning with Partially-Shared Architecture 1 2 1 1,3 Takayuki MORITO 1, Osamu SUGIYAMA 2, Ryosuke KOJIMA 1, Kazuhiro NAKADAI 1,3 1 2 ( ) 3 Tokyo Institute of

Διαβάστε περισσότερα

FPGA. Fast and Efficient Tsunami Propagation Simulation with FPGA and GPGPU

FPGA. Fast and Efficient Tsunami Propagation Simulation with FPGA and GPGPU FPGA GPGPU 1 1 2, 3, 1 2, 3 FPGA(Field Programmable Gate Array) GPGPU(General Purpose computing on Graphics Processing Unit) FPGA GPU FPGA GPU CPU Fast and Efficient Tsunami Propagation Simulation with

Διαβάστε περισσότερα

Transient Voltage Suppression Diodes: 1.5KE Series Axial Leaded Type 1500 W

Transient Voltage Suppression Diodes: 1.5KE Series Axial Leaded Type 1500 W Features 1. Reliable low cost construction utilizing molded plastic technique 2. Both bi-directional and uni-directional devices are available 3. Fast response time 4. Excellent clamping capacity 5. 1500

Διαβάστε περισσότερα

Αριθµητικές Μέθοδοι Collocation. Απεικόνιση σε Σύγχρονες Υπολογιστικές Αρχιτεκτονικές

Αριθµητικές Μέθοδοι Collocation. Απεικόνιση σε Σύγχρονες Υπολογιστικές Αρχιτεκτονικές Αριθµητικές Μέθοδοι Collocation Απεικόνιση σε Σύγχρονες Υπολογιστικές Αρχιτεκτονικές Hermite Collocation Method BVP L B uxy (, ) = f(, xy), (, xy) Ω uxy (, ) = gxy (, ), (, xy) Ω Red Black Collocation

Διαβάστε περισσότερα

Ενσωµατωµένα Υπολογιστικά Συστήµατα (Embedded Computer Systems)

Ενσωµατωµένα Υπολογιστικά Συστήµατα (Embedded Computer Systems) Ενσωµατωµένα Υπολογιστικά Συστήµατα (Embedded Computer Systems) Μαθηµα 2 ηµήτρης Λιούπης 1 Intel SA-1110 µc StrongARM core. System-on-Chip. Εξέλιξη των SA-110 και SA-1100. 2 ARM cores ARM: IP (intellectual

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΚΡΗΤΗΣ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΚΡΗΤΗΣ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΚΡΗΤΗΣ Ηράκλειο 05/09/2016 Αριθμός Πρωτ.5995 ΤΡΟΠΟΠΟΙΗΣΗ ΔΙΑΚΗΡΥΞΗΣ 5478/03.08.2016 Έχοντας υπόψη: τις διατάξεις του ισχύοντος Οδηγού Χρηματοδότησης

Διαβάστε περισσότερα

Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές

Εισαγωγή στους Ηλεκτρονικούς Υπολογιστές στους Ηλεκτρονικούς Υπολογιστές http://courseware.mech.ntua.gr/ml23021/ 5 ο Μάθημα Λεωνίδας Αλεξόπουλος Λέκτορας ΕΜΠ E-mail: leo@mail.ntua.gr URL: http://users.ntua.gr/leo 1 Στα προηγούμενα μaθήματα Συστήματα

Διαβάστε περισσότερα

Παρουσίαση 1 ης Άσκησης:

Παρουσίαση 1 ης Άσκησης: Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Παρουσίαση 1 ης Άσκησης: Ανάπτυξη παράλληλου κώδικα σε πολυπύρηνες αρχιτεκτονικές κοινής

Διαβάστε περισσότερα

Fourier transform, STFT 5. Continuous wavelet transform, CWT STFT STFT STFT STFT [1] CWT CWT CWT STFT [2 5] CWT STFT STFT CWT CWT. Griffin [8] CWT CWT

Fourier transform, STFT 5. Continuous wavelet transform, CWT STFT STFT STFT STFT [1] CWT CWT CWT STFT [2 5] CWT STFT STFT CWT CWT. Griffin [8] CWT CWT 1,a) 1,2,b) Continuous wavelet transform, CWT CWT CWT CWT CWT 100 1. Continuous wavelet transform, CWT [1] CWT CWT CWT [2 5] CWT CWT CWT CWT CWT Irino [6] CWT CWT CWT CWT CWT 1, 7-3-1, 113-0033 2 NTT,

Διαβάστε περισσότερα

Bundle Adjustment for 3-D Reconstruction: Implementation and Evaluation

Bundle Adjustment for 3-D Reconstruction: Implementation and Evaluation 3 2 3 2 3 undle Adjustment or 3-D Reconstruction: Implementation and Evaluation Yuuki Iwamoto, Yasuyuki Sugaya 2 and Kenichi Kanatani We describe in detail the algorithm o bundle adjustment or 3-D reconstruction

Διαβάστε περισσότερα

Orthogonalization Library with a Numerical Computation Policy Interface

Orthogonalization Library with a Numerical Computation Policy Interface Vol. 46 No. SIG 7(ACS 10) May 2005 DGKS PC 10 8 10 14 4.8 Orthogonalization Library with a Numerical Computation Policy Interface Ken Naono, Mitsuyoshi Igai and Hiroyuki Kidachi We propose an orthogonalization

Διαβάστε περισσότερα

Με τον όρο μνήμη αναφερόμαστε στα μέσα που χρησιμοποιούνται για την αποθήκευση προγραμμάτων και δεδομένων σε έναν υπολογιστή ή άλλη ψηφιακή

Με τον όρο μνήμη αναφερόμαστε στα μέσα που χρησιμοποιούνται για την αποθήκευση προγραμμάτων και δεδομένων σε έναν υπολογιστή ή άλλη ψηφιακή Μνήμη Με τον όρο μνήμη αναφερόμαστε στα μέσα που χρησιμοποιούνται για την αποθήκευση προγραμμάτων και δεδομένων σε έναν υπολογιστή ή άλλη ψηφιακή ηλεκτρονική συσκευή, σε προσωρινή ή μόνιμη βάση. Τα σύγχρονα

Διαβάστε περισσότερα

Stabilization of stock price prediction by cross entropy optimization

Stabilization of stock price prediction by cross entropy optimization ,,,,,,,, Stabilization of stock prediction by cross entropy optimization Kazuki Miura, Hideitsu Hino and Noboru Murata Prediction of series data is a long standing important problem Especially, prediction

Διαβάστε περισσότερα

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Ενότητα 12: Συνοπτική Παρουσίαση Ανάπτυξης Κώδικα με το Matlab Σαμαράς Νικόλαος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Ενσωματωμένα Συστήματα

Ενσωματωμένα Συστήματα Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Ενσωματωμένα Συστήματα Ενότητα 6: Η αρχιτεκτονική του ARM. Δρ. Μηνάς Δασυγένης mdasyg@ieee.org Εργαστήριο Ψηφιακών Συστημάτων και Αρχιτεκτονικής Υπολογιστών

Διαβάστε περισσότερα

ΤΕΧΝΙΚΕΣ ΠΡΟ ΙΑΓΡΑΦΕΣ ΕΞΟΠΛΙΣΜΟΥ

ΤΕΧΝΙΚΕΣ ΠΡΟ ΙΑΓΡΑΦΕΣ ΕΞΟΠΛΙΣΜΟΥ ΤΕΧΝΙΚΕΣ ΠΡΟ ΙΑΓΡΑΦΕΣ ΕΞΟΠΛΙΣΜΟΥ Α. κεντρικός εξυπηρετητής τεµάχια : 5 (πέντε) Ολα τα µέρη του προσφερόµενου εξοπλισµού να είναι του ιδίου κατασκευαστή. Αριθµός µονάδων. 5 Τα τµήµατα που συνθέτουν το σύστηµα

Διαβάστε περισσότερα

Yoshifumi Moriyama 1,a) Ichiro Iimura 2,b) Tomotsugu Ohno 1,c) Shigeru Nakayama 3,d)

Yoshifumi Moriyama 1,a) Ichiro Iimura 2,b) Tomotsugu Ohno 1,c) Shigeru Nakayama 3,d) 1,a) 2,b) 1,c) 3,d) Quantum-Inspired Evolutionary Algorithm 0-1 Search Performance Analysis According to Interpretation Methods for Dealing with Permutation on Integer-Type Gene-Coding Method based on

Διαβάστε περισσότερα

Probabilistic Approach to Robust Optimization

Probabilistic Approach to Robust Optimization Probabilistic Approach to Robust Optimization Akiko Takeda Department of Mathematical & Computing Sciences Graduate School of Information Science and Engineering Tokyo Institute of Technology Tokyo 52-8552,

Διαβάστε περισσότερα

Parallel Implementation of John Conway s Game of Life

Parallel Implementation of John Conway s Game of Life Parallel Implementation of John Conway s Game of Life Μπεχτσούδης Ανέστης - mpechtsoud@ceid.upatras.gr Abstract: Στην παρούσα εργασία πραγματοποιήθηκαν παράλληλες υλοποιήσεις σε μοντέλο κοινής μνήμης του

Διαβάστε περισσότερα

Metal thin film chip resistor networks

Metal thin film chip resistor networks Metal thin film chip resistor networks AEC-Q200 Compliant Features Relative resistance and relative TCR definable among multiple resistors within package. Relative resistance : ±%, relative TCR: ±1ppm/

Διαβάστε περισσότερα

DEIM Forum 2018 F3-5 657 8501 1-1 657 8501 1-1 E-mail: yuta@cs25.scitec.kobe-u.ac.jp, eguchi@port.kobe-u.ac.jp, ( ) ( )..,,,.,.,.,,..,.,,, 2..., 1.,., (Autoencoder: AE) [1] (Generative Stochastic Networks:

Διαβάστε περισσότερα

ΤΕΧΝΙΚΕΣ ΑΥΞΗΣΗΣ ΤΗΣ ΑΠΟΔΟΣΗΣ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ I

ΤΕΧΝΙΚΕΣ ΑΥΞΗΣΗΣ ΤΗΣ ΑΠΟΔΟΣΗΣ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ I ΤΕΧΝΙΚΕΣ ΑΥΞΗΣΗΣ ΤΗΣ ΑΠΟΔΟΣΗΣ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ I MIPS Η MIPS (Microprocessor without Interlocked Pipeline Stages) είναι μία αρχιτεκτονική συνόλου εντολών (ISA) γλώσσας μηχανής που αναπτύχθηκε από την εταιρεία

Διαβάστε περισσότερα

ΘΕΜΑ PROJECT COMPILER FLAGS ΤΡΑΧΑΝΗΣ ΔΗΜΗΤΡΗΣ 6108 ΤΡΑΧΑΝΗΣ ΓΕΩΡΓΙΟΣ 5789

ΘΕΜΑ PROJECT COMPILER FLAGS ΤΡΑΧΑΝΗΣ ΔΗΜΗΤΡΗΣ 6108 ΤΡΑΧΑΝΗΣ ΓΕΩΡΓΙΟΣ 5789 ΘΕΜΑ PROJECT COMPILER FLAGS ΤΡΑΧΑΝΗΣ ΔΗΜΗΤΡΗΣ 6108 ΤΡΑΧΑΝΗΣ ΓΕΩΡΓΙΟΣ 5789 Γενικά Οι compilers προσφέρουν μία σειρά από τεχνικές βελτιστοποίησης Στόχοι: Αύξηση ταχύτητας εκτέλεσης Μείωση μεγέθους Εφικτές

Διαβάστε περισσότερα

EM 361: Παράλληλοι Υπολογισμοί

EM 361: Παράλληλοι Υπολογισμοί ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ EM 361: Παράλληλοι Υπολογισμοί Ενότητα #2: Αρχιτεκτονική Διδάσκων: Χαρμανδάρης Ευάγγελος ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Διαβάστε περισσότερα

The Tersoff many-body potential: Sustainable performance through vectorization

The Tersoff many-body potential: Sustainable performance through vectorization The Tersoff many-body potential: Sustainable performance through vectorization Markus Höhnerbach Ahmed E. Ismail Paolo Bientinesi High Performance and Automatic Computing Group Aachen Institute for Advanced

Διαβάστε περισσότερα

Wavelet based matrix compression for boundary integral equations on complex geometries

Wavelet based matrix compression for boundary integral equations on complex geometries 1 Wavelet based matrix compression for boundary integral equations on complex geometries Ulf Kähler Chemnitz University of Technology Workshop on Fast Boundary Element Methods in Industrial Applications

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ανάκτηση Πληροφορίας Αποτίμηση Αποτελεσματικότητας Μέτρα Απόδοσης Precision = # σχετικών κειμένων που επιστρέφονται # κειμένων που επιστρέφονται Recall = # σχετικών κειμένων που επιστρέφονται # συνολικών

Διαβάστε περισσότερα

Κεφάλαιο 1 Αφαιρετικότητα και Τεχνολογία Υπολογιστών (Computer Abstractions and Technology)

Κεφάλαιο 1 Αφαιρετικότητα και Τεχνολογία Υπολογιστών (Computer Abstractions and Technology) Κεφάλαιο 1 Αφαιρετικότητα και Τεχνολογία Υπολογιστών (Computer Abstractions and Technology) 1 Υπολογιστές Οι υπολογιστές μπορούν να χωριστούν σε τρεις κατηγορίες, βάση της εφαρμογής τους: Επιτραπέζιοι

Διαβάστε περισσότερα

Επιστηµονικός Υπολογισµός Ι

Επιστηµονικός Υπολογισµός Ι Επιστηµονικός Υπολογισµός Ι Ενότητα 7 : ιαχείρηση Μητρώων Ειδικής οµής Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Advanced Data Indexing

Advanced Data Indexing Advanced Data Indexing (Προηγμένη ευρετηρίαση δεδομένων) Ιεραρχίες Μνήμης Δευτερεύουσα Μνήμη Το Κενό Μεταξύ CPU και Μνήμης 1.000.000.000 100.000.000 10.000.000 0,1 x ns 1.000.000 100.000 10.000 1.000 100

Διαβάστε περισσότερα

Διάλεξη 15 Απόδοση της Ιεραρχίας Μνήμης Βελτιστοποίηση της απόδοσης

Διάλεξη 15 Απόδοση της Ιεραρχίας Μνήμης Βελτιστοποίηση της απόδοσης ΗΥ 232 Οργάνωση και Σχεδίαση Υπολογιστών Διάλεξη 5 Απόδοση της Ιεραρχίας Μνήμης Βελτιστοποίηση της απόδοσης Νίκος Μπέλλας Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων Πόσο μεγάλη είναι μια μνήμη cache;

Διαβάστε περισσότερα

Indexing Methods for Encrypted Vector Databases

Indexing Methods for Encrypted Vector Databases Computer Security Symposium 2013 21-23 October 2013 305-0006 1-1-1 junpei.kawamoto@acm.org LSH LSH LSH Indexing Methods for Encrypted Vector Databases Junpei Kawamoto Faculty of Engineering, Information

Διαβάστε περισσότερα

CMOS Technology for Computer Architects

CMOS Technology for Computer Architects CMOS Technology for Computer Architects Iakovos Mavroidis Giorgos Passas Manolis Katevenis Lecture 13: On chip SRAM Technology FORTH ICS / EURECCA & UoC GREECE ABC A A E F A BCDAECF A AB C DE ABCDAECF

Διαβάστε περισσότερα

Παρουςίαςθ 2 θσ Άςκθςθσ:

Παρουςίαςθ 2 θσ Άςκθςθσ: Εθνικό Μετςόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιςτών Εργαςτήριο Υπολογιςτικών Συςτημάτων Παρουςίαςθ 2 θσ Άςκθςθσ: Ανάπτυξη παράλληλου κώδικα και μελζτη επίδοςησ του αλγόριθμου

Διαβάστε περισσότερα

Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ)

Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2017-18 Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ) (Αρχιτεκτονική x86-64) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Αρχιτεκτονική

Διαβάστε περισσότερα

OIKONOMIKO ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ 76-104 34 ΑΘΗΝΑ - ΤΗΛ. 010-8203911 - FAX: 010-8226204 - http://www.aueb.gr

OIKONOMIKO ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ 76-104 34 ΑΘΗΝΑ - ΤΗΛ. 010-8203911 - FAX: 010-8226204 - http://www.aueb.gr Ε Λ Λ Η Ν Ι Κ Η Δ Η Μ Ο Κ Ρ Α Τ Ι Α OIKONOMIKO ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΑΤΗΣΙΩΝ 76-104 34 ΑΘΗΝΑ - ΤΗΛ. 010-8203911 - FAX: 010-8226204 - http://www.aueb.gr 14PROC001936787 2014-03-20 ΔΙΑΚΗΡΥΞΗ Ν ο 121/2014

Διαβάστε περισσότερα

Αρχιτεκτονική x86(-64) 32-bit και 64-bit λειτουργία. Αρχιτεκτονική x86(-64) Αρχιτεκτονική επεξεργαστών x86(-64) Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ)

Αρχιτεκτονική x86(-64) 32-bit και 64-bit λειτουργία. Αρχιτεκτονική x86(-64) Αρχιτεκτονική επεξεργαστών x86(-64) Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2017-18 Αρχιτεκτονικές Συνόλου Εντολών (ΙΙ) (Αρχιτεκτονική x86-64) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Αρχιτεκτονική

Διαβάστε περισσότερα

Simplex Crossover for Real-coded Genetic Algolithms

Simplex Crossover for Real-coded Genetic Algolithms Technical Papers GA Simplex Crossover for Real-coded Genetic Algolithms 47 Takahide Higuchi Shigeyoshi Tsutsui Masayuki Yamamura Interdisciplinary Graduate school of Science and Engineering, Tokyo Institute

Διαβάστε περισσότερα

Υ- 01 Αρχιτεκτονική Υπολογιστών Πολυεπεξεργαστές

Υ- 01 Αρχιτεκτονική Υπολογιστών Πολυεπεξεργαστές Υ- 01 Αρχιτεκτονική Υπολογιστών Πολυεπεξεργαστές Αρης Ευθυμίου Το σημερινό μάθημα! Εισαγωγή σε παράλληλα συστήματα Ταξινόμιση κατά Flynn Μέθοδοι επικοινωνίας: shared memory, message passing Δίκτυα διασύνδεσης!

Διαβάστε περισσότερα

GridFTP-APT: Automatic Parallelism Tuning Mechanism for Data Transfer Protocol GridFTP

GridFTP-APT: Automatic Parallelism Tuning Mechanism for Data Transfer Protocol GridFTP THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS TECHNICAL REPORT OF IEICE. -APT: TCP 565-871 1-5 E-mail: {t-itou,oosaki,imase}@ist.osaka-u.ac.jp TCP TCP TCP -APT ( with Automatic

Διαβάστε περισσότερα

Εισαγωγή στην πληροφορική -4

Εισαγωγή στην πληροφορική -4 Εισαγωγή στην πληροφορική 6 (, 64) bits Μνήµη Θέση (κύτταρο cell) µνήµης, χωράει λέξεις (words) εντολές (πρόγραµµα), αριθµοί (δεδοµένα) Αριθµοί: δυαδική (binary) αναπαράσταση = = = 4 = 4 = 5 = 7 Εισαγωγή

Διαβάστε περισσότερα

Εικονική Μνήμη (Virtual Μemory)

Εικονική Μνήμη (Virtual Μemory) ΗΥ 431 Αρχιτεκτονική Παραλλήλων Συστημάτων Διάλεξη 16 Εικονική Μνήμη (Virtual Μemory) Νίκος Μπέλλας Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ Απλό πείραμα int *data = malloc((1

Διαβάστε περισσότερα

Συσταδοποίηση Ι. Τι είναι συσταδοποίηση. Εφαρμογές. Εφαρμογές. Εισαγωγή Θέματα που θα μας απασχολήσουν σήμερα. Πότε μια συσταδοποίηση είναι καλή;

Συσταδοποίηση Ι. Τι είναι συσταδοποίηση. Εφαρμογές. Εφαρμογές. Εισαγωγή Θέματα που θα μας απασχολήσουν σήμερα. Πότε μια συσταδοποίηση είναι καλή; Τι είναι συσταδοποίηση Εύρεση συστάδων αντικειμένων έτσι ώστε τα αντικείμενα σε κάθε ομάδα να είναι όμοια (ή να σχετίζονται) και διαφορετικά (ή μη σχετιζόμενα) από τα αντικείμενα των άλλων ομάδων Συσταδοποίηση

Διαβάστε περισσότερα

Εικονική Μνήμη (Virtual Μemory)

Εικονική Μνήμη (Virtual Μemory) ΗΥ 232 Οργάνωση και Σχεδίαση Υπολογιστών Διάλεξη 16 Εικονική Μνήμη (Virtual Μemory) Νίκος Μπέλλας Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Η/Υ Απλό πείραμα int *data = malloc((1

Διαβάστε περισσότερα

Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών H/Y Department of Electrical and Computer Engineering. Εργαστήριο 8. Χειμερινό Εξάμηνο

Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών H/Y Department of Electrical and Computer Engineering. Εργαστήριο 8. Χειμερινό Εξάμηνο Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών H/Y Department of Electrical and Computer Engineering Οργάνωση και Σχεδίαση Η/Y (HY232) Εργαστήριο 8 Χειμερινό Εξάμηνο 2016-2017 1. Προσομοίωση λειτουργίας ιεραρχίας

Διαβάστε περισσότερα

Κεφάλαιο 3. Αριθμητική Υπολογιστών Review. Hardware implementation of simple ALU Multiply/Divide Real Numbers

Κεφάλαιο 3. Αριθμητική Υπολογιστών Review. Hardware implementation of simple ALU Multiply/Divide Real Numbers Κεφάλαιο 3 Αριθμητική Υπολογιστών Review signed numbers, 2 s complement, hex/dec/bin, add/subtract, logical Hardware implementation of simple ALU Multiply/Divide Real Numbers 1 Προσημασμένοι και Απρόσημοι

Διαβάστε περισσότερα

Matrices and vectors. Matrix and vector. a 11 a 12 a 1n a 21 a 22 a 2n A = b 1 b 2. b m. R m n, b = = ( a ij. a m1 a m2 a mn. def

Matrices and vectors. Matrix and vector. a 11 a 12 a 1n a 21 a 22 a 2n A = b 1 b 2. b m. R m n, b = = ( a ij. a m1 a m2 a mn. def Matrices and vectors Matrix and vector a 11 a 12 a 1n a 21 a 22 a 2n A = a m1 a m2 a mn def = ( a ij ) R m n, b = b 1 b 2 b m Rm Matrix and vectors in linear equations: example E 1 : x 1 + x 2 + 3x 4 =

Διαβάστε περισσότερα

Retrieval of Seismic Data Recorded on Open-reel-type Magnetic Tapes (MT) by Using Existing Devices

Retrieval of Seismic Data Recorded on Open-reel-type Magnetic Tapes (MT) by Using Existing Devices No. 3 + 1,**- Technical Research Report, Earthquake Research Institute, University of Tokyo, No. 3, pp. + 1,,**-. MT * ** *** Retrieval of Seismic Data Recorded on Open-reel-type Magnetic Tapes (MT) by

Διαβάστε περισσότερα

New Adaptive Projection Technique for Krylov Subspace Method

New Adaptive Projection Technique for Krylov Subspace Method 1 2 New Adaptive Projection Technique for Krylov Subspace Method Akinori Kumagai 1 and Takashi Nodera 2 Generally projection technique in the numerical operation is one of the preconditioning commonly

Διαβάστε περισσότερα

An Efficient Calculation of Set Expansion using Zero-Suppressed Binary Decision Diagrams

An Efficient Calculation of Set Expansion using Zero-Suppressed Binary Decision Diagrams 22 27 2 SP-C 2012 2011 Short Paper ZDD An Eicient Calculation o Set Expansion using Zero-Suppressed Binary Decision Diagrams Masaaki Nishino Norihito Yasuda Toru Kobayashi NTT Cyber Solutions Laboratories,

Διαβάστε περισσότερα

Anomaly Detection with Neighborhood Preservation Principle

Anomaly Detection with Neighborhood Preservation Principle 27 27 Workshop on Information-Based Induction Sciences (IBIS27) Tokyo, Japan, November 5-7, 27. Anomaly Detection with Neighborhood Preservation Principle Tsuyoshi Idé Abstract: We consider a task of anomaly

Διαβάστε περισσότερα

MPSoCs για εφαρμογές Video

MPSoCs για εφαρμογές Video MPSoCs για εφαρμογές Video Αρχιτεκτονικές επεξεργασίας video SIMD (single instruction multiple data). Βασίζονται στον παραλληλισμό των δεδομένων. Χαρακτηρίζονται από πολλαπλά datapaths τα οποία εκτελούν

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2: Χειρισμός Δεδομένων

ΚΕΦΑΛΑΙΟ 2: Χειρισμός Δεδομένων ΚΕΦΑΛΑΙΟ 2: Χειρισμός Δεδομένων 2.1 Αρχιτεκτονική Υπολογιστών 2.2 Γλώσσα Μηχανής 2.3 Εκτέλεση προγράμματος 2.4 Αριθμητικές και λογικές εντολές 2.5 Επικοινωνία με άλλες συσκευές 2.6 Άλλες αρχιτεκτονικές

Διαβάστε περισσότερα

Παράλληλος προγραμματισμός: παράλληλες λ υπολογιστικές πλατφόρμες και ανάλυση προγραμμάτων

Παράλληλος προγραμματισμός: παράλληλες λ υπολογιστικές πλατφόρμες και ανάλυση προγραμμάτων Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Παράλληλος προγραμματισμός: παράλληλες λ υπολογιστικές πλατφόρμες και ανάλυση προγραμμάτων

Διαβάστε περισσότερα

ER-Tree (Extended R*-Tree)

ER-Tree (Extended R*-Tree) 1-9825/22/13(4)768-6 22 Journal of Software Vol13, No4 1, 1, 2, 1 1, 1 (, 2327) 2 (, 3127) E-mail xhzhou@ustceducn,,,,,,, 1, TP311 A,,,, Elias s Rivest,Cleary Arya Mount [1] O(2 d ) Arya Mount [1] Friedman,Bentley

Διαβάστε περισσότερα

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Στόχος Θεματικής Ενότητας Οι μαθητές να περιγράφουν τους βασικούς τομείς της Επιστήμης των Υπολογιστών και να μπορούν

Διαβάστε περισσότερα

+85 C Snap-Mount Aluminum Electrolytic Capacitors. High Voltage Lead free Leads Rugged Design. -40 C to +85 C

+85 C Snap-Mount Aluminum Electrolytic Capacitors. High Voltage Lead free Leads Rugged Design. -40 C to +85 C +85 C Snap-Mount Capacitors FEATURES High ripple Current Ratings Large Case Size Selection Extended Life High Voltage Lead free Leads Rugged Design SPECIFICATIONS Tolerance ±20% at 120Hz, 20 C Operating

Διαβάστε περισσότερα

Maude 6. Maude [1] UIUC J. Meseguer. Maude. Maude SRI SRI. Maude. AC (Associative-Commutative) Maude. Maude Meseguer OBJ LTL SPIN

Maude 6. Maude [1] UIUC J. Meseguer. Maude. Maude SRI SRI. Maude. AC (Associative-Commutative) Maude. Maude Meseguer OBJ LTL SPIN 78 Maude 1 Maude [1] UIUC J. Meseguer ( 1 ) ( ) Maude Maude SRI 90 UIUC SRI Maude SRI S. Eker C++ Maude 2 Maude Meseguer OBJ 1983-84 OBJ2[3] OBJ Maude OBJ 1 CafeOBJ 3 Maude 4 Maude CafeOBJ Maude: A Computer

Διαβάστε περισσότερα

Buried Markov Model Pairwise

Buried Markov Model Pairwise Buried Markov Model 1 2 2 HMM Buried Markov Model J. Bilmes Buried Markov Model Pairwise 0.6 0.6 1.3 Structuring Model for Speech Recognition using Buried Markov Model Takayuki Yamamoto, 1 Tetsuya Takiguchi

Διαβάστε περισσότερα

Επιστηµονικός Υπολογισµός Ι

Επιστηµονικός Υπολογισµός Ι Επιστηµονικός Υπολογισµός Ι Ενότητα 3 : Βασικές Πράξεις Αριθµητικής Γραµµικής Αλγεβρας Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής Αδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας Ενότητα 3: Διασωλήνωση, Clusters, Στοιχεία Παράλληλου Προγραμματισμού Δρ. Μηνάς Δασυγένης mdasyg@ieee.org

Διαβάστε περισσότερα

Αντικειμενοστραφής Προγραμματισμός

Αντικειμενοστραφής Προγραμματισμός 1 Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου Αντικειμενοστραφής Προγραμματισμός Ενότητα 4 : Πίνακες Ιωάννης Τσούλος 2 Ανοιχτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ηπείρου Τμήμα Μηχανικών Πληροφορικής

Διαβάστε περισσότερα

SMD Transient Voltage Suppressors

SMD Transient Voltage Suppressors SMD Transient Suppressors Feature Full range from 0 to 22 series. form 4 to 60V RMS ; 5.5 to 85Vdc High surge current ability Bidirectional clamping, high energy Fast response time

Διαβάστε περισσότερα

ΠΡΟΣ: Κάθε ενδιαφερόμενο ΘΕΜΑ: Πρόσκληση εκδήλωσης ενδιαφέροντος για τη Προμήθεια Εξοπλισμού Πληροφορικής.

ΠΡΟΣ: Κάθε ενδιαφερόμενο ΘΕΜΑ: Πρόσκληση εκδήλωσης ενδιαφέροντος για τη Προμήθεια Εξοπλισμού Πληροφορικής. ΔΙΕΥΘΥΝΣΗ ΟΙΚΟΝΟΜΙΚΩΝ ΥΠΗΡΕΣΙΩΝ Τμήμα: Προμηθειών Ταχ. Δ/νση : Αλ.Φλέμιγκ 34, Τ.Κ.-16672 Βάρη Πληροφορίες : Π.Σκουλούδης Τηλέφωνο : 210 8979197 Fax : 2108979198 e-mail : skouloudis@fleming.gr Αριθμ. Πρωτ:

Διαβάστε περισσότερα

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών. Εισαγωγή. Συστήματα Παράλληλης Επεξεργασίας 9 ο Εξάμηνο

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών. Εισαγωγή. Συστήματα Παράλληλης Επεξεργασίας 9 ο Εξάμηνο Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Εισαγωγή 9 ο Εξάμηνο Περιεχόμενο μαθήματος Ζητήματα παράλληλων αρχιτεκτονικών Κατηγορίες

Διαβάστε περισσότερα

ΘΕΜΑ : MULTIMEDIA & ΤΕΧΝΟΑΟΓΙΑ

ΘΕΜΑ : MULTIMEDIA & ΤΕΧΝΟΑΟΓΙΑ ΤΕΧΝΟΛΟΓΙΚΟ ΙΛΡΥΜΑ ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ & ΟΙΚΟΝΟΜΙΑΣ ΓΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ritwiakfi ΕΡΓΑΣΙΑ ΘΕΜΑ : MULTIMEDIA & ΤΕΧΝΟΑΟΓΙΑ ΚΛΡΑΒΕΡΒΕΡΗΣ ΓΕΩΡΓΙΟΣ ΕΙΣΗΓΗΤΗΣ : ΒΛΑΣΑΜΙΛΗΣ ΣΤΑΥΡΟΣ Κ.ΛΒΛΑΛ ΑΠΡΙΛΙΟΣ 2000 Μ, Η

Διαβάστε περισσότερα

ΤΟ ΠΑΡΟΝ ΕΡΓΟ ΣΥΓΧΡΗΜΑΤΟΔΟΤΕΙΤΑΙ ΚΑΤΑ 80% ΤΟ ΑΝΩΤΕΡΟ ΑΠΟ ΤΟ ΕΥΡΩΠΑΪΚΟ ΤΑΜΕΙΟ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ (Ε.Τ.Π.Α.) ΚΑΙ ΚΑΤΑ ΤΟ 20% ΑΠΟ ΕΘΝΙΚΟΥΣ ΠΟΡΟΥΣ

ΤΟ ΠΑΡΟΝ ΕΡΓΟ ΣΥΓΧΡΗΜΑΤΟΔΟΤΕΙΤΑΙ ΚΑΤΑ 80% ΤΟ ΑΝΩΤΕΡΟ ΑΠΟ ΤΟ ΕΥΡΩΠΑΪΚΟ ΤΑΜΕΙΟ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ (Ε.Τ.Π.Α.) ΚΑΙ ΚΑΤΑ ΤΟ 20% ΑΠΟ ΕΘΝΙΚΟΥΣ ΠΟΡΟΥΣ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΕΥΡΩΠΑΙΚΟ ΤΑΜΕΙΟ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΤΟ ΠΑΡΟΝ ΕΡΓΟ ΣΥΓΧΡΗΜΑΤΟΔΟΤΕΙΤΑΙ ΚΑΤΑ 80% ΤΟ ΑΝΩΤΕΡΟ ΑΠΟ ΤΟ ΕΥΡΩΠΑΪΚΟ ΤΑΜΕΙΟ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ (Ε.Τ.Π.Α.) ΚΑΙ ΚΑΤΑ ΤΟ 20% ΑΠΟ ΕΘΝΙΚΟΥΣ

Διαβάστε περισσότερα

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks

A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks P2P 1,a) 1 1 1 P2P P2P P2P P2P A Method for Creating Shortcut Links by Considering Popularity of Contents in Structured P2P Networks NARISHIGE Yuki 1,a) ABE Kota 1 ISHIBASHI Hayato 1 MATSUURA Toshio 1

Διαβάστε περισσότερα

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He

IPSJ SIG Technical Report Vol.2014-CE-127 No /12/6 CS Activity 1,a) CS Computer Science Activity Activity Actvity Activity Dining Eight-He CS Activity 1,a) 2 2 3 CS Computer Science Activity Activity Actvity Activity Dining Eight-Headed Dragon CS Unplugged Activity for Learning Scheduling Methods Hisao Fukuoka 1,a) Toru Watanabe 2 Makoto

Διαβάστε περισσότερα

Processor-Memory (DRAM) ιαφορά επίδοσης

Processor-Memory (DRAM) ιαφορά επίδοσης Processor-Memory (DRAM) ιαφορά επίδοσης µproc 6%/yr 98 98 982 983 984 985 986 987 988 989 99 99 992 993 994 995 996 997 998 999 2 2 22 23 24 25 Performance Processor-Memory Performance Gap: (grows 5% /

Διαβάστε περισσότερα

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση)

Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών Κρυφές Μνήμες. (οργάνωση, λειτουργία και απόδοση) Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κρυφές Μνήμες (οργάνωση, λειτουργία και απόδοση) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Ιεραρχία συχνά και το

Διαβάστε περισσότερα

Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες

Ιεραρχία Μνήμης. Ιεραρχία μνήμης και τοπικότητα. Σκοπός της Ιεραρχίας Μνήμης. Κρυφές Μνήμες Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Αρχιτεκτονική Υπολογιστών 2016-17 Κρυφές Μνήμες (οργάνωση, λειτουργία και απόδοση) http://mixstef.github.io/courses/comparch/ Μ.Στεφανιδάκης Για βελτίωση της απόδοσης

Διαβάστε περισσότερα

Προγραμματισμός GPUs μέσω του περιβάλλοντος CUDA

Προγραμματισμός GPUs μέσω του περιβάλλοντος CUDA Προγραμματισμός GPUs μέσω του περιβάλλοντος CUDA Κωνσταντινίδης Ηλίας Υποψήφιος Διδάκτωρ Τμήμα Πληροφορικής & Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Νόμος Moore density doubles/18m

Διαβάστε περισσότερα

Παράλληλοι υπολογιστές

Παράλληλοι υπολογιστές Παράλληλοι υπολογιστές Κ.Γ. Μαργαρίτης προσαρμογή από το μάθημα του Barry Wilkinson ITCS 4145/5145 2006Cluster Computing Univ. of North Carolina at Charlotte 1 Απαίτηση για ταχύτητα Συνεχής απαίτηση για

Διαβάστε περισσότερα

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ Συνολικού Προϋπολογισμού:73.800,οο Η/Υ ΤΥΠΟΣ-Α

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ Συνολικού Προϋπολογισμού:73.800,οο Η/Υ ΤΥΠΟΣ-Α ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ Συνολικού Προϋπολογισμού:73.800,οο Η/Υ ΤΥΠΟΣ-Α A. Desktop PC INTEL CORE i5-2500 3.30 GHz ή ανώτερο - Windows 7 PRO (64 bit) Τουλάχιστον 20 τεμάχια προτύπου: Επεξεργαστής: Μνήμη cache:

Διαβάστε περισσότερα

Οι τέσσερις αρχές για τον σχεδιασμό του συνόλου εντολών μιας μηχανής είναι:

Οι τέσσερις αρχές για τον σχεδιασμό του συνόλου εντολών μιας μηχανής είναι: More material! Οι τέσσερις αρχές για τον σχεδιασμό του συνόλου εντολών μιας μηχανής είναι: 1. Η απλότητα στη σχεδίαση οφείλεται στη κανονικοποίηση. Πολλά χαρακτηριστικά των εντολών της μηχανης MIPS οφείλονται

Διαβάστε περισσότερα

ΘΕΜΑ : Πρόσκληση εκδήλωσης ενδιαφέροντος για την «Προμήθεια Λογισμικού και ηλεκτρονικού εξοπλισμού ΔΕ Φιλιατρών». ΑΝΑΚΟΙΝΩΣΗ

ΘΕΜΑ : Πρόσκληση εκδήλωσης ενδιαφέροντος για την «Προμήθεια Λογισμικού και ηλεκτρονικού εξοπλισμού ΔΕ Φιλιατρών». ΑΝΑΚΟΙΝΩΣΗ Ελληνική ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΝΟΜΟΣ ΜΕΣΣΗΝΙΑΣ KΥΠΑΡΙΣΣΙΑ 5/0/204 Αρ. Πρωτ: 25073 ΑΥΤΟΤΕΛΕΣ ΓΡΑΦΕΙΟ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΟΡΓΑΝΩΣΗΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΜΑ : Πρόσκληση εκδήλωσης ενδιαφέροντος για την «Προμήθεια Λογισμικού

Διαβάστε περισσότερα

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ COMPUTER SCIENCE DEPARTMENT UNIVERSITY OF CRETE Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463 4 η Σειρά Ασκήσεων Ψαράκη Μαρία-Γεωργία ΜΕΤ 556 psaraki@csd.uoc.gr Εαρινό Εξάμηνο 2008-2009

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Μελέτη των επεξεργαστών 32 bit της εταιρίας Microchip Technology και ανάπτυξη σειράς υποδειγµατικών εφαρµογών

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Μελέτη των επεξεργαστών 32 bit της εταιρίας Microchip Technology και ανάπτυξη σειράς υποδειγµατικών εφαρµογών ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Μελέτη των επεξεργαστών 32 bit της εταιρίας Microchip Technology και ανάπτυξη σειράς υποδειγµατικών εφαρµογών ΤΑΣΙΟΥ ΕΥΘΥΜΙΑ (1563) ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: ρ.καλομοιροσ ΙΩΑΝΝΗΣ ΕΠΙΚΟΥΡΟΣ

Διαβάστε περισσότερα

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων

Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών Εργαστήριο Υπολογιστικών Συστημάτων Παράλληλος προγραμματισμός: Σχεδίαση και υλοποίηση παράλληλων προγραμμάτων 9 ο Εξάμηνο

Διαβάστε περισσότερα

!! " # $%&'() * & +(&( 2010

!!  # $%&'() * & +(&( 2010 !!" #$%&'() *& (&( 00 !! VISNIK OF HE VOLODYMYR DAL EAS UKRAINIAN NAIONAL UNIVERSIY 8 (50) 00 8 (50) 00 HE SCIENIFIC JOURNAL " 996 WAS FOUNDED IN 996 " - - " I IS ISSUED WELVE IMES A YEAR "#$% Founder

Διαβάστε περισσότερα

1 (forward modeling) 2 (data-driven modeling) e- Quest EnergyPlus DeST 1.1. {X t } ARMA. S.Sp. Pappas [4]

1 (forward modeling) 2 (data-driven modeling) e- Quest EnergyPlus DeST 1.1. {X t } ARMA. S.Sp. Pappas [4] 212 2 ( 4 252 ) No.2 in 212 (Total No.252 Vol.4) doi 1.3969/j.issn.1673-7237.212.2.16 STANDARD & TESTING 1 2 2 (1. 2184 2. 2184) CensusX12 ARMA ARMA TU111.19 A 1673-7237(212)2-55-5 Time Series Analysis

Διαβάστε περισσότερα

(Υπογραϕή) (Υπογραϕή) (Υπογραϕή)

(Υπογραϕή) (Υπογραϕή) (Υπογραϕή) (Υπογραϕή) (Υπογραϕή) (Υπογραϕή) (Υπογραϕή) F 1 F 1 RGB ECR RGB ECR δ w a d λ σ δ δ λ w λ w λ λ λ σ σ + F 1 ( ) V 1 V 2 V 3 V 4 V 5 V 6 V 7 V 8 V 9 V 10 M 1 M 2 M 3 F 1 F 1 F 1 10 M 1

Διαβάστε περισσότερα